شناسایی حروف چاپی فارسی با استفاده از دسته بندهای ماشین بردار پشتیبان
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 667
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CITCOMP02_277
تاریخ نمایه سازی: 7 اسفند 1396
Abstract:
یکی از تحولات عمده یادگیری ماشین، ارایه روش های ترکیبی است که با استفاده از ترکیب نتایج چندین دسته بند جزء، یک دسته بند بسیار دقیق ایجاد می شود. در این مقاله روشی برای ترکیب دسته بندی ها ارایه و بر روی مجموعه ای از حروف چاپی فارسی مورد آزمایش قرار گرفته است. این روش در هر مرحله تکرار، داده های ورودی را به صورت تصادفی به چند دسته تقسیم می کند سپس بر روی هر دسته روش آنالیز اجزای اصلی را اعمال کرده و ویژگی ها را استخراج می کند. بردار ویژگی نهایی از ادغام این ویژگی ها ایجاد و با دسته بند ماشین بردار پشتیبان، آموزش داده می شود. ویژگی این روش نسبت به سایر روش های ترکیبی افزایش همزمان درصد صحت دسته بند پایه و پراکندگی نمونه ها در هر مرحله است. با استفاده از این روش به طور متوسط درصد صحت ماشین بردار پشتیبان برای داده های حروف چاپی فارسی بهبود یافته است.
Keywords:
باز شناسایی حروف چاپی فارسی , دسته بندی حروف , استخراج ویژگی ها , ماشین بردار پشتیبان , فناوری Optical Character Reader (OCR)
Authors
محمدمسعود جاویدی
دانشیار گروه کامپیوتر، دانشگاه باهنر، کرمان، ایران
مرضیه قدیری ترشاب
گروه کامپیوتر، موسسه آموزش عالی بهمنیار کرمان، کرمان، ایران