CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازشناسی برخط کلمات دست‌نویس فارسی با واژگانی گسترده

عنوان مقاله: بازشناسی برخط کلمات دست‌نویس فارسی با واژگانی گسترده
شناسه ملی مقاله: ICMVIP05_102
منتشر شده در پنجمین کنفرانس ماشین بینایی و پردازش تصویر در سال 1387
مشخصات نویسندگان مقاله:

سیدمحمد رضوی - دانشگاه بیرجند ،گروه الکترونیک و مخابرات
احسان اله کبیر - دانشگاه تربیت مدرس ، بخش مهندسی برق

خلاصه مقاله:
در این مقاله روشی برای بازشناسی برخط کلمات فارسی ارائه می شود. ابتدا زیر- کلمات موجود در کلمۀ نوشته شده استخراج می شوند. علائم هر زیر- کلمه و مکان نسبی آنها تشخیص داده می شوند و با توجه به آن گروهی از کلمات، که از نظر تعداد زیر- کلمات و علامتهای موجود در هر زیر- کلمه با کلمۀ ورودی یکسان هستند، از واژگانی با 30000 کلمه، انتخاب می شوند. هر کدام از زیر- کلمات موجود در کلمۀ ورودی، با توجه به گروه انتخاب شده، با تعدادی از زیر- کلمات مقایسه می شود و براساس فاصله ای که با آن زیر- کلمات دارد امتیازی به هرکدام از آنان داده می شود. برای هر یک از کلمات گروه انتخابی امتیازی بر اساس امتیازات زیر- کلمات آن محاسبه م یشود و کلمه ای که بیشترین امتیاز را آورده باشد به کلمۀ ورودی نسبت داده می شود. روش پیشنهادی روی یک متن انتخابی ،که توسط یک نویسنده نوشته شده است،آزمایش شد. میزان بازشناسی درست 94,9 % برای متن نمونه بدست آمده است.

کلمات کلیدی:
فارسی، بازشناسی، دست‌نوشته برخط، کمترین فاصله، واژگان گسترده

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/52078/