تشخیص هوشمند و خودکار غلط های تایپی در پایگاه داده های بزرگ بدون استفاده از لغت نامه

Publish Year: 1396
نوع سند: مقاله ژورنالی
زبان: Persian
View: 525

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_TJEE-47-1_015

تاریخ نمایه سازی: 10 تیر 1396

Abstract:

غلط های تایپی یکی از مشکلات مهم در سیستم های کامپیوتری و سیستم های پایگاه داده ای است. وجود غلط های تایپی در پایگاه داده ها نهتنها از نظر صحت پایگاه داده مشکل ساز هستند، بلکه باعث می شوند به هنگام ضرورت نتوان رکورد واردشده را بازیابی کرد. همین امر گاه باعثمی شود که کاربر مجددا همان رکورد را وارد پایگاه داده نماید که باعث به وجود آمدن افزونگی می گردد. روش های موجود تشخیص غلط ها، مبتنیبر لغت نامه هستند. بدین معنی که از یک لغت نامه بزرگ که همه لغات آن صحیح فرض می شوند استفاده می کنند و اگر کلمه ای در لغت نامه نباشدبه عنوان غلط تایپی شناخته می شود. تهیه لغت نامه ای بزرگ و با دقت بالا بسیار پرهزینه و زمان بر است. به علاوه چنین لغت نامه ای مختص یکزمینه خاص (مثلا محیط پزشکی) است و قابل استفاده و در زمینه های دیگر (مثلا جامعه شناسی) نیست. در این مقاله روشی ارایه می شود که بدوننیاز به لغت نامه می تواند غلط های تایپی را تشخیص دهد. روش پیشنهادی با چند معیار مرسوم ارزیابی شده است. نتایج آزمایش ها نشان دهندهدقت 93/5 درصدی برای این روش است. علاوه بر دقت بالای روش پیشنهادی، عدم نیاز به لغت نامه یک ویژگی منحصر به فرد برای آن به شمارمی رود.

Keywords:

تشخیص غلط های تایپی , غلط های املایی , فازی

Authors

الناز زعفرانی معطر

مربی، گروه مهندسی کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

محمدرضا فیضی درخشی

استادیار، گروه مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

آزاده روحانی

مربی، گروه مهندسی کامپیوتر، واحد خسروشاه، دانشگاه آزاد اسلامی، خسروشاه، ایران