بازشناسی برون خط زیرکلمات فارسی چاپی براساس ترکیب ویژگی های موجک ، سراسری و محلی با استفاده از فرهنگ لغت موقعیت زیرکلمات

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 205

This Paper With 20 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCONF08_158

تاریخ نمایه سازی: 25 بهمن 1400

Abstract:

خلاصه در این مقاله به ارائه روشی جدید برای بازشناسی برون خط زیرکلمات فارسی چاپی، براساس ترکیب ویژگی های موجک، سراسری و محلی، با استفاده از الگوریتم ماشین بردارپشتیبان (SVM) می پردازیم. در روش پیشنهادی، پس از انجام پیش پردازش برروی تصاویر زیرکلمات در ۴ سایز و ۴ فونت، مرحله استخراج ویژگی با استفاده از ترکیب ویژگی های موجک، سراسری و محلی صورت گرفته است. در بخش طبقه بندی یک فرهنگ لغت از موقعیت احتمالی زیرکلمات در کلمات پایگاه داده تشکیل داده سپس و از الگوریتم SVM چند کلاسه با درنظر گرفتن موقعیت زیرکلمه در کلمه ورودی، استفاده می کنیم. پایگاه داده مورد استفاده در این مقاله، شامل تعداد ۵۸۴۲۱ زیرکلمه فارسی در چهار اندازه و چهار فونت مختلف است که میانگین نرخ بازشناسی الگوریتم پیشنهادی ۹۸.۷۵% بدست آمد. نتایج پیاده سازی نشان می دهد که ترکیب ویژگی ها با هم، در کنار استفاده از طبقه بند قدرتمند SVM با درنظر گرفتن فرهنگ لغت موقعیت زیرکلمات، باعث افزایش دقت و قابلیت اطمینان در روش بازشناسی گردیده است.

Keywords:

کلمات کلیدی: بازشناسی زیرکلمات فارسی , استخراج ویژگی , فرهنگ لغت موقعیت زیرکلمات , ویژگی های موجک , ویژگی های سراسری و محلی , الگوریتم ماشین بردار پشتیبان.

Authors

سارا خسروی

عضو هیات علمی گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه پیام نور، تهران، ایران.