مروری بر سیستم های OCR به منظور شناسایی متون فارسی- عربی- اردو

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 598

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICSEE02_026

تاریخ نمایه سازی: 8 تیر 1398

Abstract:

شناسایی کاراکترهای زبانهای فارسی- عربی- اردو به دلیل پیوستگی حروف به مراتب سختتر از تشخیص کاراکترهای سایر زبانها میباشند. اگر کاراکترهای این زبانها با فونت نستعلیق نگارش شوند پیچیدگی شناسایی دو چندان میشود، چرا که شناسایی خط نستعلیق به دلیل ساختار پیچیده اش کار دشواری میباشد. در مقاله ی جاری، به معرفی جنبه های مختلف طراحی یک سیستم OCR (سیستم های بازشناسی نوری نویسه) میپردازیم و در ادامه به بررسی سیستمهای OCR1 ارائه شده به منظور تشخیص کاراکترهای زبانهای فارسی- عربی- اردو میپردازیم. زیرا کاراکترهای این زبانها از نظر ساختار بسیار شبیه به هم میباشند. به منظور بررسی دقیق سیستمهای ارائه شده در گذشته، از دو معیار اصلی و فرعی استفاده نمودیم. معیارهای اصلی عبارتند از: الگوی ورودی، نوع زبان، هدف از تشخیص و نوع نوشتار. این معیارها باعث تمایز سیستمهای بازشناسی نوری نویسه از یکدیگر میشوند. میزان فرآوانی پژوهشها بر اساس این چهار معیار توسط نرم افزار SPSS مورد بررسی قرار گرفته است. نتایج بدست آمده نشان میدهد بیشترین میزان فرآوانی در زمینه ی شناسایی تصاویر حروف دست نویس فارسی میباشد. معیارهای فرعی که با هدف عمیق شدن بررسی ها و به منظور دقت بیشتر در نظر گرفته شده اند عبارتند از؛ سال انتشار، عنوان پژوهش، نوع فونت، روشهای حل، مجموعه داده و میزان دقت. در ادامه نتایج مقایسه ی پژوهشها با کمک معیارهای فرعی و دو معیار اصلی، در قالب جدول مطرح شده است. تحقیقات گستردهای در حوزه OCR انجام شده است اما با نگاه ریز بینانه ای میتوان خلاءهای تحقیقاتی موجود را یافت و یک منبع پژوهشی کامل از تحقیقات بروز در این حوزه را جمع آوری نمود و به هدف نهایی که تسهیل در روند اجرایی شدن پژوهش دیگر محققین است رسید. لازمه ی این امر شناسایی، گردآوری، مطالعه و نتیجه گیری از تحقیقات صورت گرفته ی پیشین است.

Authors

مهسا شکوهی

دانشجوی دوره کارشناسی ارشد فناوری اطلاعات موسسه آموزش عالی ادیبان

حامد شیدائیان

دانشجوی دوره دکتری مهندسی کامپیوتر دانشگاه تهران