تشخیص حروف چاپی فارسی با استفاده از روش ترکیبی
Publish place: Regional Conference on Computer Science, Computer Engineering and Information Technology
Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,716
This Paper With 12 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
DOROUDIT01_097
تاریخ نمایه سازی: 7 آذر 1391
Abstract:
در تشخیص حروف بتن مبتنی بر الفبای عربی به دلیل متصل بودن حروف، مشکلات عمدهای در مراحل جداسازی و تشخیص وجود دارد. زیرا به علت اتصال حروف فارسی به یکدیگر، امکان تنظیم دقیق نقاط جداسازی حروف وجود ندارد. برای غلبه بر این مشکلات در این مقاله، روشی ترکیبی برای تشخیص حروف فارسی ارائه شده است که در آن جداسازی حروف (که منبع اصلی خطا در سیستمهای تشخیص حروف فارسی کنونی است) به صورت کامل انجام نشده و فقط حرف اول هر زیر کلمه جدا شده و تشخیص داده میشود . سپس این حرف اول، معیاری برای دسته بندی زیر کلمات قرار میگیرد و هر زیر کلمه فقط در دست مربوط تشخیص داده نمیشود . این روش روشی انعطافپذیر و قدرتمند است که میتواند بهآسانی توسعه داده شود و برای فونت های ختلف به کار برده شود. همچنین با استفاده از روشهای پیش پردازش و پس پردازش مناسب، چارچوب ساده و صمیمی کامل پیشنهاد میدهد . نتایج آزمایش روی متون مختلف، دقت بالای این روش را نشان میدهد که OCR برای توسعه سیستم برای استفاده صفات تجاری مناسب میباشد .
Keywords:
Authors
محسن زند
عضو هیئت علمی گروه کامپیوتر دانشگاه آزاد اسلامی واحد دورود
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :