CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مطالعه ی مدلهای لغوی به منظور بررسی شباهت اسناد

عنوان مقاله: مطالعه ی مدلهای لغوی به منظور بررسی شباهت اسناد
شناسه ملی مقاله: BPJ01_135
منتشر شده در اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات در سال 1392
مشخصات نویسندگان مقاله:

مجید محبی - کارشناس ارشد
علیرضا طالب پور - استادیاردانشگاه شهید بهشتی

خلاصه مقاله:
جستجوی شباهت اسنادبه کاربران اجازه میدهد تااسنادمشابه به یک پرس وجوی سندی را درمجموعه اسنادپیدا کنند برای یک پرس وجوی سندی داده شده سیستم جستجوی شباهت یک لیست رتبه بندی ازشباهت اسناد به سندپرس وجود را ارایه میدهد درواقع جستجوی شباهت اسناد میتواند به عنوان بازیابی متن باپرس وجوی طولانی درنظر گرفته شود هدف این مقاله مطالعه ی تعدادی مدل لغوی برای بررسی و یافتن شباهت بین اسنادوپرس وجوهای سندی است دراین راستا ساختارسندمتنی و مراحل پیش پردازش سند که شامل تحلیل لغوی متن حذف کلمات عمومی جداکردن پسوند توسط ریشه یابی مطرح میشود وسپس مدلی بولی استانداردمدل فضای برداری مدل احتمالاتی مدل بولی توسعه یافته مینیمم و ماکسیمم ترکیب شده مدل پایس مدل فضای برداری تعمیم داده شده و مدل نمایه سازی معنایی پنهان برای یافتن شباهت اسنادموردمطالعه قرارمیگیرد

کلمات کلیدی:
بازیابی اطلاعات، شباهت اسناد، شباهت سندوپرس جو، واژه شاخص

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/225401/