CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی و ارزیابی رویکردهای شناسایی موجودیت ها

عنوان مقاله: بررسی و ارزیابی رویکردهای شناسایی موجودیت ها
شناسه ملی مقاله: PFCONF04_184
منتشر شده در چهارمین همایش ملی علوم و فناوری های نوین ایران در سال 1397
مشخصات نویسندگان مقاله:

حمیدرضا مدرسی - دانشجوی کارشناسی ارشد دانشکده و پژوهشکده مهندسی فناوری اطلاعات دانشگاه جامع امام حسین(ع
مجید غیوری ثالث - استادیار دانشکده و پژوهشکده مهندسی فناوری اطلاعات دانشگاه جامع امام حسین(ع)

خلاصه مقاله:
یکی از چالشهای اساسی در جامعه اطلاعاتی موضوع شناسایی موجودیتها است. موضوع تشخیص و شناسایی موجودیتها و تعیین نوع طبقه آنها یکی از مسایل مهم و کاربردی در حوزه پردازش زبانهای طبیعی و همچنین بازیابی اطلاعات است. اولین مرحله در مبحث ا ستخراج اطلاعات، ت شخیص و د سته بندی موجودیتها در متن ا ست. بیشتر سامانه های تشخیص موجودیت به سمت پیدا نمودن ا سامی ا شخاص، مکانها و سازمانها تمرکز دارند. شیوه های ما شینی و ان سانی مختلفی جهت شنا سایی موجودیت ها تاکنون تو سط متخ ص صان در این حوزه مطرح شده ا ست، اما تمامی روشهای مبتنی بر ما شین محدودیتهایی مانند عدم دقت لازم و عدم ا ستفاده از جمع سپاری را دارند و به همین جهت محققان به سمت ا ستفاده از شیوه های مبتنی بر انسان با قابلیت جمع سپاری برای حل این مسایل حرکت کرده اند. این روشها نیز به خاطر استفاده از کارگران انسانی دارای هزینه بالایی است. جهت غلبه بر این محدودیتها و بهبود عملکرد شنا سایی موجودیتها از رویکرد ترکیبی ما شین _ ان سان ا ستفاده می شود که در این مقاله در رویکرد ترکیبی ابتدا از شیوه ماشینی simjoin برای شناسایی موجودیتها استفاده کرده و خروجی آن را به رویکرد انسانی با چهارچوب AMT برای ادامه مسیله شنا سایی میدهیم. نتایج آزمایشها روی مجموعه داده ها ن شان میدهد که رویکرد ترکیبی دقت بالاتری در مقای سه با شیوه های فقط ما شینی یا انسانی کسب میکند. ضمن اینکه در رویکرد ترکیبی زمان شنا سایی موجودیتها کاهش پیدا کرده و همچنین ریزوظایف کمتری نسبت به الگوریتمهای مورد مقایسه تولید شده که باعث کاهش هزینه شناسایی میگردد.

کلمات کلیدی:
شناسایی موجودیت ها، رویکرد ترکیبی، ریز وظایف، رویکرد انسانی، رویکرد ماشینی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/780873/