CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مطالعه و بررسی اثر پسوند و پیشوند در شباهت معنایی جملات زبان فارسی با هدف کاربردی در سیستمهای بازیابی اطلاعات

عنوان مقاله: مطالعه و بررسی اثر پسوند و پیشوند در شباهت معنایی جملات زبان فارسی با هدف کاربردی در سیستمهای بازیابی اطلاعات
شناسه ملی مقاله: IDMC03_075
منتشر شده در سومین کنفرانس داده کاوی در سال 1388
مشخصات نویسندگان مقاله:

نینا محسنی کبیر - دانشجوی کارشناسی ارشد دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایر
بهروز مینایی بیدگلی - دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران
امید کاشفی - دانشکده مهندسی کامپیوتردانشگاه علم و صنعت ایران

خلاصه مقاله:
امروزه حجم زیادی از اطلاعات در شبکه ارتباطی جهانی وجود دارد پیدا کرده داده های مورد نظر کاربر روی وب در یک روش بهنگام و سودمند یکی از مسائل چالش برانگیز است یکی از روشهای موثر برای کاهش و سازماندهی حجم زیاد داده ها پیدا کردن مستندات متشابه و دسته بندی آنهاست این مقاله تکنیکی را برای حذف وندها و تاثیر آن برروی تشخیص مستندات متشابه ارائه کرده است این روش با بررسی وندها و استثنائات آنها در زبان فارسی حدود 300 وند و ترکیبات آنها را استخراج و با حذف آنها ا زمتن نتایج بهتری را برای مشابهت یابی متون فارسی بدست اورده است ارزیابی های ما نشان دادند که حذف وندها از متون فارسی روشهای تشابه متن را بهبود میدهد

کلمات کلیدی:
بازیابی اطلاعات، تشابه متن، ریخت شناسی، وندها، زبان فارسی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/108947/