بررسی و مقایسه بازیابی تحمل پذیر با استفاده از تکنیک N-Gram و فاصله لون شتاین در زبان عربی

جلال  رضایی نور; یوسف زارعی طاهر; محمد رضا زوین; سید مساعد موسوی نصر

بررسی و مقایسه بازیابی تحمل پذیر با استفاده از تکنیک N-Gram و فاصله لون شتاین در زبان عربی

Publish place: 3nd National Conference on Computer Science

Publish Year: 1394

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 11 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/482118

شناسه ملی سند علمی:

NCCOS03_168

تاریخ نمایه سازی: 9 مرداد 1395

Abstract:

یکی ازمسائل مهم دربازیابی اطلاعات قابلیت بازیابی تحمل پذیرمی باشد بازیابی تحمل پذیربه این معنی است که اگرکاربر به دلایلی ازجمله غلط املایی، عدم بیان نیازاطلاعاتی و عدم اشنایی با چگونگی اطلاعات موجود درپایگاه داده ما نتواند درخواست خود را بصورت صحیح وکامل بیان کند سیستم بازیابی اطلاعات با استفاده ازقابلیت تحمل پذیراین خطاها را ت احدممکن کاهش داده و بتواند نتایج موردپسند کاربر را بازیابی و به آن ارایه کند دراین مقاله سعی شده است برای افزایش قابلیت تحمل پذیری درزبان عربی ازدوتکنیک N-Gram و فاصله لون شتاین برای تصحیح خطا و ارایه کلمات مشابه درپرسو جو کاربر استفاده شود همچنین باپیاده سازی منبع عظیمی ازاطلاعات به زبان عربی سعی شده است بهترین حالت ازبین زیرمجموعه های یک گرام دوگرام سه گرام و چهارگرام و لون شتاین را که باعث افزایش کارایی و قابلیت تحمل پذیری دربازیابی اطلاعات می شود را انتخاب کنیم

Keywords:

زبان عربی , بازیابی تحمل پذیر , N-Gram , لونشتاین , تصحیح خطا , کلمات مشابه

Authors

جلال رضایی نور

استادیار گروه مهندسی صنایع دانشکده فنی ومهندسی دانشگاه قم قم

یوسف زارعی طاهر

گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم

محمد رضا زوین

گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم

سید مساعد موسوی نصر

گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

شیروانی پ، وطن خواه م، یغمایی خ، 1393، «بازشناسی متون ...
آرمین ن، شمس فرد م، «تبدیل متن محاوره‌ای فارسی به ...
بهی ع، خامه یار الف، سرایی م، « آشکارسازی زبان ...
شیخائی م، شیری قیداری س، 5 جستجو چینش بهینه حروف ...
Jesus Vilares, Juan Otero(2011) .Managing misspelled queries in IR applications. ...
.Kukich, K. (1992). Techniques for automatically correcting words in text. ...
Grigori Sidorov, Francisco Velasquez(20 14). Syntactic N-grams as machine learning ...
Ethan Miller, Dan Shen, Junli Liu, and Charles Nicholas(2000) _ ...
Grigori Sidorov, Francisco Velasquez(20 14). Syntactic N-grams as machine learning ...

نمایش کامل مراجع