بهیود بازشناسی زیرحروف فارسی با تشخیص زیرحروف شاخص و ادغام زیرحروف مشابه
Publish place: Fourth International Conference on Information Technology, Computer and Telecommunication Engineering of Iran
Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 294
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICTBC04_007
تاریخ نمایه سازی: 5 شهریور 1400
Abstract:
یکی از رویکردهای بازشناسی کلمات فارسی رویکرد مبتنی بر جداسازی است. در این رویکرد سعی می شود بدنهزیرکلمه به حروف تشکیل دهنده آن بخش بندی شود. مهمترین چالش این رویکرد تشخیص نقطه انفصال است. در اینپژوهش به جای تشخیص نقطه انفصال، بخش های اتصال دهنده زیرحروف از بدنه زیرکلمات حذف شده و زیرحروف استخراجشده اند. در مرحله تشخیص زیرحروف به وسیله شبکه عصبی، برای کاهش تعداد کلاس ها برخی از حروف شاخص که تشخیصآنها از روی ویژگی های شکلی با خطای نزدیک به صفر انجام می شود از مجموعه زیرحروف جدا شده است. همچنینزیرحروفی که از لحاظ شکل ظاهری شبیه هستند با هم ادغام شده و به عنوان یک کلاس تشخیص در نظر گرفته شده اند.در نهایت زیرحروفی که با هم ادغام شده اند به وسیله یک شبکه عصبی جدا آموزش داده شده و از یکدیگر تفکیک می شوند.نتایج نشان می دهد که این روش بهبود زیادی در تشخیص زیرحروف ایجاد می کند.
Keywords:
Authors
زهرا بهمنی
عضو هیات علمی دانشگاه صنعتی خاتم الانبیاء بهبهان