CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مروری بر روش های جستجوی کلمه در اسناد تصویری

عنوان مقاله: مروری بر روش های جستجوی کلمه در اسناد تصویری
شناسه ملی مقاله: CSCONFERENCE01_084
منتشر شده در نخستین همایش ملی دستاوردهای نوین در مهندسی برق، مهندسی کامپیوتر و مهندسی پزشکی در سال 1402
مشخصات نویسندگان مقاله:

مسلم محمدی - استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه پیام نور تهران
مجید ایرانپورمبارکه - استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشکده فنی و مهندسی، دانشگاه پیام نور تهران

خلاصه مقاله:
کتابخانه های سرتاسر دنیا حاوی اطلاعات باارزشی هستند که با پیشرفت فناوری دیجیتال و جهت حفظ این منابع باارزش،به صورت اسکن شده (تصویر) درآمده اند. جستجو روی این اسناد تصویری کار بسیار زمان بری است. یک راه حل, استفاده ازبازشناسی کاراکتر نوری (OCR) برای تبدیل اسناد کاغذی اسکن شده به اسناد متنی و استفاده از موتورهای بازیبی متن است.فناوری های بازشناسی کاراکتر نوری موجود در مورد فونت های استاندارد با پس زمینه تمیز خوب کار می کند، اما زمانی کهکیفیت اسناد چاپی افت می کند و همچنین در مورد اسناد دست-نویس نتایج بسیار ضعیفی را نشان می دهد. رهیافت جایگزینبرای اندیس گذاری متون چاپی قدیمی و دست نویسء جستجوی کلمات است. در این مقاله. سعی شده است تا مروری کامل برروش های جستجوی کلمه در اسناد تصویری انجام گیرد. دسته بندی های مختلف از دیدگاه های متخصصین این حوزه و همچنینمزایا و معایب تکنیک های ارائه شده تا به امروز. جهت ایجاد بینش کامل در این زمینه، خصوصا جهت کاربرد در اسناد فارسی،آورده شده است.

کلمات کلیدی:
جستجوی کلمه تصویری، بازیابی کلمه تصویری، اندیسگذاری اسناد تصویری، بازیابی مبتنی بر محتوای تصویر

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1852318/