بکارگیری دسته بندی کننده و رتبه بندی کننده آنتروپی بیشینه در فرایند تعیین مرجع ضمایر زبان فارسی

نفیسه سادات, موسوی; غلام رضا, قاسم ثانی

بکارگیری دسته بندی کننده و رتبه بندی کننده آنتروپی بیشینه در فرایند تعیین مرجع ضمایر زبان فارسی

عنوان مقاله: بکارگیری دسته بندی کننده و رتبه بندی کننده آنتروپی بیشینه در فرایند تعیین مرجع ضمایر زبان فارسی
شناسه ملی مقاله: ACCSI14_023
منتشر شده در چهاردهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1387

مشخصات نویسندگان مقاله:

نفیسه سادات موسوی - دانشگاه صنعتی شریف دانشکده مهندسی کامپیوتر
غلام رضا قاسم ثانی - دانشگاه صنعتی شریف دانشکده مهندسی کامپیوتر

خلاصه مقاله:

تعیین عبارات اسمی هم -مرجع یکی از شاخه های تحقیقاتی مطرح در زمینه پردازش زبا ن های طبیعی است و نقش موثری در کاربردهایی همچون ترجمه ماشینی، خلاصه سازی خودکار متون، پاسخگویی خودکار به سوالات و استخراج اطلاعات دارد که در هر یک از آن ها درک صحیحی از متن حائز اهمیت است. تعیین عبارات اسمی هم -مرجع به فرایندی اطلاق می شود که در آن تمام عبارات اسمی که به یک موجودیت واحد اشاره دارند، تعیین می گردند. فرایند تعیین عبارات اسمی هم- مرجع را می توان به دو دسته روش های زبانشناسی و روش های یادگیری ماشین تقسیم نمود. روش های زبان شناسی به اطلاعات زبان شناسی بسیاری نیاز دارند که بدست آوردن این اطلاعات فرایندی پر خطا و زمان بر است . ولی روش های یادگیری ماشین به اطلاعات زبان شناسی کمتری احتیاج دارند و با بکارگیری آن ها نتایج بهتری حاصل می شود. فرایند تعیین مرجع ضمایر، یک زیر بخش مهم و چالش انگیز از فرایند تعیین عبارات اسمی هم -مرجع است که در آن تنها تعیین مرجع ضمایر مورد توجه قرار می گیرد. در این مقاله، ابتدا روش های یادگیری ماشین بکار رفته در حوزه تعیین عبارات اسمی هم مرجع /تعیین مرجع ضمایر دسته بندی و شرح داده می شوند و سپس نحوه اعمال دو روش بر روی زبان فارسی، ارائه شده و نتایج آن ها گزارش خواهد شد.

کلمات کلیدی:

پردازش زبان طبیعی، یادگیری ماشین، تعیین عبارات اسمی هم- مرجع، تعیین مرجع ضمایر، دسته بندی، رتبه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/60771/