رفع ابهام معنایی کلمات فارسی با استفاده از رویکرد نظارت شده الگوریتمهای IBL

Publish Year: 1395
نوع سند: مقاله ژورنالی
زبان: Persian
View: 66

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_CSJI-1-2_001

تاریخ نمایه سازی: 14 بهمن 1402

Abstract:

در هر زبان کلماتی مبهم وجود دارند که دارای معانی متفاوتی هستند. مساله یافتن معنای صحیح کلمه ی دارای معانی متعدد، از مسایل جاری در حوزه پردازش زبانهای طبیعی محسوب میشود. انتخاب معنی درست ممکن است برای انسان بسیار واضح و آسان باشد ولی تشخیص اینکه کدام یک از معانی موجود برای یک کلمه بایستی در جمله خاص انتخاب شود برای ماشین دشوار است. چهار رویکرد متفاوت برای رفع ابهام معنایی کلمات وجود دارد: رویکرد مبتنی بر دانش، رویکرد تحت نظارت، رویکرد نیمه نظارتی و رویکرد بدون نظارت هستند.در میان این روش ها ما روش یادگیری مبتنی بر نمونه(IBL) که بر اساس رویکرد نظارتی است برگزیدیم. در این مقاله دو دسته ویژگی مبتنی بر کلمات موضوعی معرفی کردیم، دسته اول وجود و عدم وجود کلمات موضوعی را وابسته به وزن هر کلمه موضوعی تعیین می کند و دسته دوم مجموع وزن کلمات موضوعی در هر جمله را مشخص می کند. بعد از انجام عملیات پیش پردازش روی نمونه های ذخیره شده برای هر کلمه، دو ماتریس ویژگی استخراج می شود. هر ماتریس ویژگی به عنوان ورودی نرم افزار وکا در نظر گرفته شده است. سپس با استفاده از طبقه بندی کننده مبتنی بر نمونه و با روش اعتبار سنجی متقابل ۱۰ تایی نتایج را ارائه می دهیم. سپس نتایج حاصل از هر ماتریس ویژگی را برای یافتن ویژگی بهینه مورد بررسی قرار می دهیم. همچنین روش خود را روی دیگر الگوریتم های یادگیری ماشین مورد بررسی قرار داده و نتایج را ارائه می کنیم.میانگین صحت عملکرد روش پیشنهادی ۸۸.۳۱% میباشد.

Authors

منیر خیرمند پاریزی

دانشجوی کارشناسی ارشدکامپیوتر، دانشگاه آزاداسلامی، واحدسیرجان، ایران

رضا نورمندی پور

استادیار، گروه کامپیوتر واحدسیرجان، دانشگاه آزاداسلامی، واحدسیرجان،ایران