CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

قطعه بندی برون خط متون پیوسته فارسی

عنوان مقاله: قطعه بندی برون خط متون پیوسته فارسی
شناسه ملی مقاله: BPJ01_493
منتشر شده در اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات در سال 1392
مشخصات نویسندگان مقاله:

جلال نوروزی کردلر - دانشجوی کارشناسی ارشد
علی غفاری - مربی دانشگاه آزاد اسلامی تبریز
علی فرزان - مربی دانشگاه آزاد اسلامی شبستر

خلاصه مقاله:
دراین تحقیق بعدازبیان خلاصه ای ازمسائل ومشکلات بازشناسی متون دست نویس فارسی به شناسایی عملگرهای موروفولوژی وکاربردهای آن برای شناسایی و بخش بندی حروف فارسی درمتون دست نویس می پردازیم روش پیشنهادی این تحقیق که درقسمت قطعه بندی یک سیستم بازشناسی متن است برای بخش بندی حروف ابتدا محدوده اولیه متون شناسایی وسپس با استفاده ازالگوریتم بهبود کنتراست اثرنور پس زمینه ازبین می رود درمرحله بعد محدوده پاراگراف شناسایی شده تا بدین ترتیب نقاط اضافی غیرمتن و ضایعات مربوط به متون اسکن شده حذف گردند سپس با استفاده ازپروجکشن افقی کل متن ویژگی مربوط به خطوط استخراج شده و خطوط متن کاملا ازهم جدا میشوند با استفاده ازخواص این بردار ویژگی خطوط پایه و محدوده های بالایی و پایینی خط استخراج و ناحیه جستجو به این فضا محدود می گردد برای هرخط پروجکشن های عمودی به دست امده و قسمت های مختلف کلمات ازهم جدا میشوند درمرحله نهایی پنجره های مربوط به هرحرف به صورت جداگانه و با استفاده ازهمبستگی روی تصویر متن اعمال میشوند تا بدین ترتیب هرحرف به صورت جداگانه درمتن بخش بندی گردد

کلمات کلیدی:
بازشناسی الگو، پروجکشن، پیش پردازش، عملگرهای مورفولوژی،Feature extraction ، Image processing ، Segmentation

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/225749/