تشخیص و تصحیح کجی اسناد چاپی و دست نوشته های پیچیده فارسی با استفاده از درخت X-Y و براساس مرکز ثقل اسناد
Publish Year: 1389
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,386
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICMVIP06_018
تاریخ نمایه سازی: 20 فروردین 1390
Abstract:
تشخیص و تصحیح کجی مستندات مرحله بسیار مهمی در آنالیز مستندات می باشد تشخیص صحیح و تصحیح میزان کجی مستندات تاثیر بسزایی در دقت و کارایی قطعه بندی و آنالیز مستندات می گذارد در مستندات فارسی با توجه به مشخصات خاص نوشتاری و تاثیر شدید نویز بر کارایی الگوریتمهای ارائه شده و وابستگی الگوریتمها به کیفیت و شکل خاصی از مستندات همچنان این مشکل وجود دارد اینمشکل برای مستندات با چندین درجه کجی متفاوت در یک مستند حادتر می باشد ما دراین شیوه با استفاده از قطعه بندی به روش درخت X-Y و یا تکیه بر مفهوم مرکز ثقل اجسام الگوریتم کارای و سریعی را برای تشخیص میزان کجی مستندات ارائه نموده ایم این الگوریتم برروی 150 مستند فارسی و لاتین مورد ازمایش قرارگرفته و با صحت بیش از 89 درصد میزان کجی های متفاوت پاراگرافهای مستند را تصحیح می کند این الگوریتم برای مستندات چاپی و دست نوشته های فارسی و مستندات پیچیده مانند مجلات علمی و روزنامه ها و همچنین مستندات دارای نویز و کیفیت پایین و مستندات با چندین درجه کجی متفاوت نیز نتایج بسیار مطلوبی ارائه می دهد.
Keywords:
Authors
سیدیاسر هاشمی
بورسیه هیئت علمی گروه آموزشی نرم افزار دانشگاه آزاد اسلامی واحدمیان
علی برومندنیا
استادیار گروه آموزشی کامپیوتر دانشگاه آزاد اسلامی واحد تهران جنوب
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :