CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر نویز و روش های حذف نویز در صفحات اسکن شده

عنوان مقاله: مروری بر نویز و روش های حذف نویز در صفحات اسکن شده
شناسه ملی مقاله: ITCC01_173
منتشر شده در کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات در سال 1394
مشخصات نویسندگان مقاله:

بهزاد صادقی - دانشجو،کارشناسی ارشد،کامپیوتر،دانشکده برق وکامپیوتر دانشگاه آزاد ،واحد زنجان
رسول بابایی - دانشجو،کارشناسی ارشد،کامپیوتر،دانشکده برق وکامپیوتر دانشگاه آزاد ،واحد زنجان
مهدی حریری - استادیار و عضو هیئت علمی ، دانشکده برق و کامپیوتر دانشگاه آزاد اسلامی واحد زنجان

خلاصه مقاله:
امروزه کامپیوتر در بسیاری از جنبه های زندگی بشر دخیل شده است یکی از نتایج این مورد سند های دیجیتال میباشد.کامپیوتر درکی از سندهای نوشته شده ندارد ، بنابراین ما نیاز به تبدیل سند های دستنوشته به سند های دیجیتال داریم به اینمنظور که بتوانیم آنها را با کامپیوتر پردازش کنیم . یکی از مشهورترین روش ها برای این کار سیستم تشخیص متن می باشد (OCR)کاربردهای زیادی در زمینه سیستم تشخیص متن انگلیسی انجام گرفته است اما در زمینه زبان فارسی / عربی هنوز در حال توسعه است.یکی از اصلی ترین مشکلات در مورد زبان های فارسی / عربی حذف نویز است . به این خاطر که نقطه ها در زبان عربی و فارسینقش اساسی دارند و این موارد به سادگی به عنوان نویز شناخته می شوند ، بنابراین قضیه حذف نویز ها از یک سند فارسی بسیارسخت تر از حذف نویز یک متن معادل در زبان انگلیسی است . در این مقاله به مرور و معرفی خصوصیات و انواع نویز ، خصوصیاتزیان عربی . فارسی ، روش های متداول حذف نویز)همراه بامعرفی تابع های آن در متلب( ، بررسی یک روش جدید که به عنوانبخشی از قطعه بندی صفحه در نظر گرفته شده است خواهیم پرداخت.

کلمات کلیدی:
انواع نویز ، روش های حذف نویز ، روشی جدید در حذف نویز زبان فارسی / عربی ، خصوصیات نویز

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/450961/