CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک مدل بیشینه بی نظمی جهت رفع ابهام معنایی کلمات فارسی به کمک ویژگی های مدل سازی موضوع

عنوان مقاله: یک مدل بیشینه بی نظمی جهت رفع ابهام معنایی کلمات فارسی به کمک ویژگی های مدل سازی موضوع
شناسه ملی مقاله: CSICC16_074
منتشر شده در شانزدهمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1389
مشخصات نویسندگان مقاله:

بابک مسعودی - گروه هوش مصنوعی،دانشگاه آزاد اسلامی،مشهد
سعید راحتی - گروه برق،دانشگاه آزاد اسلامی،مشهد
اعظم استاجی - گروه زبان شناسی،دانشگاه فردوسی مشهد

خلاصه مقاله:
دراین مقاله مدلی برای رفع ابهام از کلمات مبهم و دارای معانی متعدد فارسی براساس روش دسته بندی بیشینه بی نظمی و استخراج ویژگیهای جدید پیشنهاد شده است برای ایجاد این مدل از دو دسته ویژگی استفاده شده است دسته اول ویژگیها کلمات و نشانه هایی است که همراه کلمه مبهم بکاربرده شده اند و دسته دوم ویژگیها با بکاربردن روشهای مدلسازی موضوع بدست می آید یک مدل موضوعی مدلی آماری برای استخراج چکیده موضوعات موجود در اسناد یک پیکره است درمقاله حاضر ما از روش بدون سرپرستی تخصیص پنهان دریکله LDA برای این منظور استفاده کرده ایم رفع ابهام از هرکلمه مبهم بعنوان یک مساله دسته بندی جداگانه درنظر گرفته می شود نتایج آزمایشات برایچهارکلمه مبهم پرتکرار در زبان فارسی که از پیکره پژوهشکده پردازش هوشمند علائم استخراج شد دقت حدود 97.67% را نشان میدهد که بیانگر موثربودن این روش در یافتن معنی مناسب کلمات مبهم است.

کلمات کلیدی:
بیشینه بی نظمی،تخصیص پنهان دریکله،چند معنایی،دسته بندی،رفع ابهام معنایی،مدل سازی موضوع

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/133818/