CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

کاهش واژه نامه با استفاده از ترکیب توصیف گرها جهت بازشناسی کلمات دستنویس

عنوان مقاله: کاهش واژه نامه با استفاده از ترکیب توصیف گرها جهت بازشناسی کلمات دستنویس
شناسه ملی مقاله: CSITM01_514
منتشر شده در همایش ملی مهندسی رایانه و مدیریت فناوری اطلاعات در سال 1393
مشخصات نویسندگان مقاله:

ایمان پورحسین - دانشجوی کارشناسی ارشد هوش مصنوعی، دانشگاه شهید چمران اهواز
علیرضا عصاره - دانشگاه شهید چمران اهواز، دانشیار گروه مهندسی کامپیوتر
بیتا شادگار - دانشگاه شهید چمران اهواز، استادیار گروه مهندسی کامپیوتر

خلاصه مقاله:
در این مقاله یک روش ترکیبی جدید برای کاهش واژه نامه ارائه شده است که می تواند به عنوان یک عملیات پیش پردازشی برایتشخیص کلمات فارسی و عربی استفاده شود. برای انجام این روش، پس از استخراج مولفه های شکل، تعدادی از آنها را به نقاط وتعدادی دیگر را به بدنهی زیرکلمات نسبت می دهیم. عملیات انتساب نقاط شکل، توسط قوانین از پیش تعریف شده آغاز و در ادامهتوسط یک طبقه بند بررسی می شود. نقاط تایید شده بوسیله طبقه بند، در مرحله بعد و در صورت امکان با هم ترکیب می شوند.در این مقاله، دو توصیفگر نقطه و بدنه همراه با ویژگی تعداد زیرکلمات در یک طرح موازی بکار گرفته می شوند. ورودی های واژهنامه، در مرحله اول، بر مبنای تعداد زیرکلمات، در مرحله دوم بر اساس توصیفگر بدنه و در مرحله سوم بر اساس توصیفگر نقطه ،امتیازدهی می شوند. هر سه مرحله با هم به پیش می روند و کلمات واژه نامه را بطور مستقل امتیازدهی می کنند. سرانجام در مرحلهآخر هر سه لیست امتیاز، با هم ترکیب شده و یک لیست رتبه بندی نهایی ارائه می شود. در اینجا می توان بر اساس آستانه ایمشخص، تعدادی از کلمات واژه نامه را هرس کرد و برای تشخیص دقیقتر به مرحله اصلی بازشناسی فرستاد. این طرح ترکیبی بر روی پایگاه داده IFN/ENIT که شامل 26459 تصویر، از کلمات دستنویس است آزمایش شد و توانست به نرخ کاهش 90 % و دقت 95% دست یابد.

کلمات کلیدی:
توصیفگر نقطه، توصیفگر بدنه، ترکیب توصیفگرها، کاهش واژه نامه، بازشناسی کلمات دستنویس

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/283055/