دستهبندی و بازیابی تصاویر صفحات اسناد بر مبنای ساختار ظاهری آنها

Publish Year: 1384
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 864

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI11_080

تاریخ نمایه سازی: 5 آذر 1390

Abstract:

جستجو یک سند خاص در یک پایگاه داده بزرگ از تصاویراسناد اغلب نتایج نامطلوب زیادی تولید میکند. یکی از راههای افزایش کارآیی سیستمهای بازیابی سند, جستجوی اسناد بر مبنای نوع آنها میباشد. طرحبندی ١ ظاهری صفحات عمومًا اطلاعات زیادی را در بر دارد. که میتوان از آنها برای دستهبندی اسناد بر اساس نوع بهره برد. در این مقاله یک روش دستهبندی و بازیابی صفحات اسناد بر مبنای شباهت ظاهری ساختار طرحبندی آنها ارائه کردهایم. ما از ویژگیهایی مانند ساختار ستونی, اندازه فونت, چگالی متن نواحی و ویژگیهای آماری اجزاء پیوسته نواحی استفاده کردهایم, این ویژگیها نیاز به دانش پیشینی در مورد اسناد ندارند. سپس به کمک طبقهبندی کننده درخت تصمیم روش پیشنهادی خود را ارزیابی کردهایم. در ادامه به کمک ساختار خودسازمانده ٢ درختی صفحات را بر مبنای ساختار ظاهری آنها نمایهگذاری ٣ کرده و کارایی این سیستم را ارزیابی کردهایم.

Keywords:

دستهبندی تصاویر اسناد , پایگاه داده تصاویراسناد , ذخیره و بازیابی تصاویر اسناد , ساختار طرحبندی , طبقهبندی کننده درخت تصمیم , ساختار خودسازمانده درختی

Authors

محمد اکبری

دانشگاه صنعتی امیرکبیر

رضا عزمی

دانشگاه الزهرا