CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

چالش های موجود در استخراج موجودیت های نامدار

عنوان مقاله: چالش های موجود در استخراج موجودیت های نامدار
شناسه ملی مقاله: ROUDSARIT01_030
منتشر شده در اولین همایش رویکرد های نوین در مهندسی کامپیوتر و فناوری اطلاعات در سال 1390
مشخصات نویسندگان مقاله:

شهناز پناهی - موسسه آموزش عالی غیرانتفاعی مهرآستان، آستانه اشرفیه
فرهاد عابدینی - دانشگاه آزاد اسلامی واحد رودسر و املش
صدیقه رحیمی زاده اصلی
زکیه ازادبر

خلاصه مقاله:
همواره استخراج موجودیت از متن، امر مهمی تلقی شده و در یافتن ارتباط معنایی بین متون کمک قابل ملاحظه . تاکنون روشهای زیادی برای استخراج موجودیت پیشنهاد شده است، که هر کدام برای هدفی خاص، طراحی شدهاند. با بررسی چالشهای موجود در این زمینه، و یافتن نقاط ضعف و قوت روشها، می توان در راستای بهبود و تعمیم آنها قدم برداشت و نتایج حاصل از کارآیی آنها را بهبود بخشید. در این مقاله با بررسی چالشهای مرتبط با یکی از بهترین روشهای موجود در استخراج موجودیتهای نامدار، که در مقایسه با قیاسهای انسانی عملکرد خوبی داشته، تلاش میشود که کارآیی آن مورد ارزیابی قرار گیرد. بدین منظور با اجرای آن بر روی متون مختلف، از آنتولوژی یاگو که منبع دانش پیش زمینه در این مقاله است و بررسی درصد دقت و فراخوانی آن، با استفاده از پیاده سازیهای مکرر، نقاط ضعف این روش نمایان شده و با به چالش کشیدن دلایل ضعف کارآیی این روش در استخراج موجودیت

کلمات کلیدی:
استخراج موجودیت نامدار، موجودیتهای نامدار، ویکیپدیا، آنتولوژی یاگو 2، ابهام زدایی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/119814/