بازشناسی برون خط زیرکلمات فارسی چاپی براساس ترکیب ویژگی های موجک ، سراسری و محلی  با استفاده از فرهنگ لغت موقعیت زیرکلمات

سارا خسروی

بازشناسی برون خط زیرکلمات فارسی چاپی براساس ترکیب ویژگی های موجک ، سراسری و محلی با استفاده از فرهنگ لغت موقعیت زیرکلمات

Publish place: 8th National Congress of Electrical and Computer Engineering of Iran

Publish Year: 1400

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 20 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1398990

شناسه ملی سند علمی:

COMCONF08_158

تاریخ نمایه سازی: 25 بهمن 1400

Abstract:

خلاصه در این مقاله به ارائه روشی جدید برای بازشناسی برون خط زیرکلمات فارسی چاپی، براساس ترکیب ویژگی های موجک، سراسری و محلی، با استفاده از الگوریتم ماشین بردارپشتیبان (SVM) می پردازیم. در روش پیشنهادی، پس از انجام پیش پردازش برروی تصاویر زیرکلمات در ۴ سایز و ۴ فونت، مرحله استخراج ویژگی با استفاده از ترکیب ویژگی های موجک، سراسری و محلی صورت گرفته است. در بخش طبقه بندی یک فرهنگ لغت از موقعیت احتمالی زیرکلمات در کلمات پایگاه داده تشکیل داده سپس و از الگوریتم SVM چند کلاسه با درنظر گرفتن موقعیت زیرکلمه در کلمه ورودی، استفاده می کنیم. پایگاه داده مورد استفاده در این مقاله، شامل تعداد ۵۸۴۲۱ زیرکلمه فارسی در چهار اندازه و چهار فونت مختلف است که میانگین نرخ بازشناسی الگوریتم پیشنهادی ۹۸.۷۵% بدست آمد. نتایج پیاده سازی نشان می دهد که ترکیب ویژگی ها با هم، در کنار استفاده از طبقه بند قدرتمند SVM با درنظر گرفتن فرهنگ لغت موقعیت زیرکلمات، باعث افزایش دقت و قابلیت اطمینان در روش بازشناسی گردیده است.

Keywords:

کلمات کلیدی: بازشناسی زیرکلمات فارسی , استخراج ویژگی , فرهنگ لغت موقعیت زیرکلمات , ویژگی های موجک , ویژگی های سراسری و محلی , الگوریتم ماشین بردار پشتیبان.

Authors

سارا خسروی

عضو هیات علمی گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه پیام نور، تهران، ایران.