CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک روش ترکیبی جدید برای رفع ابهام کلمات با استفاده از WordNet

عنوان مقاله: ارائه یک روش ترکیبی جدید برای رفع ابهام کلمات با استفاده از WordNet
شناسه ملی مقاله: ITCC06_053
منتشر شده در ششمین کنفرانس ملی کاربرد فناوری های نوین در علوم مهندسی در سال 1401
مشخصات نویسندگان مقاله:

علی ماروسی - استادیار، گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه تربت حیدریه، تربت حیدریه، ایران
تکتم نوجوان - دانش آموخته کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشگاه آزاد اسلامی واحد فردوس، فردوس، ایران

خلاصه مقاله:
در هر زبان کلمات زیادی وجود دارند که بسته به موقعیتی که در آن قرار گرفته اند، معانی متفاوتی را بیان می کنند. ایندسته از کلمات در متن، مبهم شناخته میشوند. مسئله یافتن معنای صحیح کلمه دارای معانی متعدد، از مسائل جاری درحوزه پردازش زبان های طبیعی محسوب می-شود. در این تحقیق ترکیبی از الگوریتم های ابهام زدایی معنی کلمات پیشنهادشده است. این ترکیب شامل انواع الگوریتم های لسک، لین، مسیر و غیره می شود. در الگوریتم پیشنهادی ابتدا جملاتپیش پردازش می شوند، ریشه کلمه و نقش آن مشخص می شود. سپس هر الگوریتم برای هر هم معنی کلمه مبهم، عددوابستگی را اعلام میکند و مقادیر به دست آمده نرمالیزه میشوند و اختلاف مقادیر نرمالیزه به دست میآید و با ترکیبالگوریتم ها بر اساس این مقادیر، هممعنی مناسب برای کلمه مبهم انتخاب میشود. توجه شود که روشهای ترکیبی مانندانتخاب اکثریت که در آنهم معنی که توسط بیشتر الگوریتم ها به عنوان خروجی انتخاب شده است دارای جواب مناسبنمی باشند. روش پیشنهادی بر روی مجموعه داده Brown ارزیابی شد و نشان داده شد که نتیجه بهتری نسبت به روشهایدیگر ابهام زدایی دارد. در برخی موارد بهبود ۳۰ % در دقت تشخیص هم معنی در مقایسه با روشهای دیگر مشاهده می شود.

کلمات کلیدی:
پردازش زبان طبیعی، ابهام زدایی معنی کلمات، الگوریتم لسک

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1795648/