مطالعه ی مدلهای لغوی به منظور بررسی شباهت اسناد

مجید, محبی; علیرضا, طالب پور

مطالعه ی مدلهای لغوی به منظور بررسی شباهت اسناد

عنوان مقاله: مطالعه ی مدلهای لغوی به منظور بررسی شباهت اسناد
شناسه ملی مقاله: BPJ01_135
منتشر شده در اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات در سال 1392

مشخصات نویسندگان مقاله:

مجید محبی - کارشناس ارشد
علیرضا طالب پور - استادیاردانشگاه شهید بهشتی

خلاصه مقاله:

جستجوی شباهت اسنادبه کاربران اجازه میدهد تااسنادمشابه به یک پرس وجوی سندی را درمجموعه اسنادپیدا کنند برای یک پرس وجوی سندی داده شده سیستم جستجوی شباهت یک لیست رتبه بندی ازشباهت اسناد به سندپرس وجود را ارایه میدهد درواقع جستجوی شباهت اسناد میتواند به عنوان بازیابی متن باپرس وجوی طولانی درنظر گرفته شود هدف این مقاله مطالعه ی تعدادی مدل لغوی برای بررسی و یافتن شباهت بین اسنادوپرس وجوهای سندی است دراین راستا ساختارسندمتنی و مراحل پیش پردازش سند که شامل تحلیل لغوی متن حذف کلمات عمومی جداکردن پسوند توسط ریشه یابی مطرح میشود وسپس مدلی بولی استانداردمدل فضای برداری مدل احتمالاتی مدل بولی توسعه یافته مینیمم و ماکسیمم ترکیب شده مدل پایس مدل فضای برداری تعمیم داده شده و مدل نمایه سازی معنایی پنهان برای یافتن شباهت اسنادموردمطالعه قرارمیگیرد

کلمات کلیدی:

بازیابی اطلاعات، شباهت اسناد، شباهت سندوپرس جو، واژه شاخص

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/225401/