An efficient hierarchical method for text region extraction in degraded document images
Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: English
View: 2,541
This Paper With 5 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICMVIP05_046
تاریخ نمایه سازی: 29 اردیبهشت 1387
Abstract:
This paper presents a clustering based method to extract text regions from degraded document images. In this method the gray scale image is decomposed into four sub-bands using discrete wavelet transform. For each pixel, the corresponding components of 3 detail sub-bands are considered as feature vector. Potential text regions are extracted by k-means clustering algorithm. We propose several heuristic constrains by which candidate text regions are refined to eliminate non-text regions. Evaluation over a set of degraded documents captured with camera, our method shows satisfactory results.
Keywords:
Authors
M valizadeh
Department of Electrical Engineering, tarbiat modares university,Tehran, Iran
E kabir
Department of Electrical Engineering, tarbiat modares university,Tehran, Iran
S jalili
Department of Electrical Engineering, tarbiat modares university,Tehran, Iran
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :