کاهش فضای جستجو در بازشناسی زیر کلمات تایپی فارسی با استفاده از ویژگی های زیست سنجه مینوشیا
Publish place: Journal of Iranian Association of Electrical and Electronics Engineers، Vol: 19، Issue: 2
Publish Year: 1401
نوع سند: مقاله ژورنالی
زبان: Persian
View: 119
This Paper With 11 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JIAE-19-2_021
تاریخ نمایه سازی: 4 تیر 1401
Abstract:
با توجه به گسترده بودن زیرکلمات تایپ شده فارسی، یافتن یک زیرکلمه و به تبع آن یک کلمه در یک متن چاپ شده کار بسیار زمانبری خواهد بود. در این مقاله روشی مبتنی بر نقاط زیست سنجه مینوشیا ارائه شده است که فضای جستجوی زیرکلمات تایپ شده فارسی را به صورت قابل توجهی کاهش می دهد. لذا تعداد نقاط و مختصات مینوشیای انشعابی و انتهایی که دو ویژگی مطرح در حوزه زیست سنجه می باشند، بعنوان ویژگی هایی برای کاهش فضای جستجو در قالب یک روش دومرحله ای استفاده شده اند. در گام نخست نقاط مینوشیا از تصویر زیرکلمه استخراج شده و در چهارخوشه که از لحاظ تعداد نقاط به یکدیگر نزدیک هستند دسته بندی می شوند، به این ترتیب فضای جستجو تقریبا نصف خواهد شد. در گام دوم با ایجاد یک مخزن از فواصل اولین تا آخرین نقطه انتهایی برای هر زیرکلمه در هر خوشه و تطبیق فاصله مذکور در تصویر آزمایشی با مخزن، فضای جستجو به مقدار قابل توجهی کاهش می یابد. نتایج بدست آمده از اعمال روش پیشنهادی بر روی تصاویر زیرکلمه موجود در پایگاه داده نشان می دهد، فضای جستجو از ۱۲۷۰۰ زیرکلمه به حدود ۵۰۰ زیرکلمه با دقت تقریبی ۹۰ درصد کاهش یافته است.
Keywords:
Authors
امین تیمورپور
University of Birjand
مهران تقی پور گرجی کلایی
University of Birjand
سیدمحمد رضوی
University of Birjand
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :