بررسی و مقایسه بازیابی تحمل پذیر با استفاده از تکنیک N-Gram و فاصله لون شتاین در زبان عربی
Publish place: 3nd National Conference on Computer Science
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,085
This Paper With 11 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCOS03_168
تاریخ نمایه سازی: 9 مرداد 1395
Abstract:
یکی ازمسائل مهم دربازیابی اطلاعات قابلیت بازیابی تحمل پذیرمی باشد بازیابی تحمل پذیربه این معنی است که اگرکاربر به دلایلی ازجمله غلط املایی، عدم بیان نیازاطلاعاتی و عدم اشنایی با چگونگی اطلاعات موجود درپایگاه داده ما نتواند درخواست خود را بصورت صحیح وکامل بیان کند سیستم بازیابی اطلاعات با استفاده ازقابلیت تحمل پذیراین خطاها را ت احدممکن کاهش داده و بتواند نتایج موردپسند کاربر را بازیابی و به آن ارایه کند دراین مقاله سعی شده است برای افزایش قابلیت تحمل پذیری درزبان عربی ازدوتکنیک N-Gram و فاصله لون شتاین برای تصحیح خطا و ارایه کلمات مشابه درپرسو جو کاربر استفاده شود همچنین باپیاده سازی منبع عظیمی ازاطلاعات به زبان عربی سعی شده است بهترین حالت ازبین زیرمجموعه های یک گرام دوگرام سه گرام و چهارگرام و لون شتاین را که باعث افزایش کارایی و قابلیت تحمل پذیری دربازیابی اطلاعات می شود را انتخاب کنیم
Keywords:
Authors
جلال رضایی نور
استادیار گروه مهندسی صنایع دانشکده فنی ومهندسی دانشگاه قم قم
یوسف زارعی طاهر
گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم
محمد رضا زوین
گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم
سید مساعد موسوی نصر
گروه مهندسی فناوری اطلاعات دانشکده فنی ومهندسی دانشگاه قم ،قم
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :