سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

استفاده از یادگیری استقرایی قوانین برای جداسازی تصویری کلمات فارسی و لاتین

Publish Year: 1381
Type: Conference paper
Language: Persian
View: 1,619

This Paper With 6 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

ACCSI08_031

Index date: 7 February 2008

استفاده از یادگیری استقرایی قوانین برای جداسازی تصویری کلمات فارسی و لاتین abstract

برای بازشناسی اسناد چند زبانه باید بتوان بهطور خودکار نوع زبان هر کلمه را تشخیص داد. در این مقاله، با استفاده از یادگیری استقرایی قوانین، روشی برای جداسازی تصویری کلمات فارسی و لاتین در متون چاپی ارائه میشود. در روش پیشنعادی از 6 ویژگی تصویری استفاده شده است. مجموعه ویژگی های استخراجشده از 896 نمونه آموزشی تصاویر کلمات فارسی و لاتین با انودع قلم ها به عنوان ورودی به ابزار یادگیری قانون c4.5 داده شد. این ابزار بر اساس این ویژگی ها 13 قانون برای جداسازی کلمات فارسی و لاتین تولید کرد. با استفاده از این قوانین در یک مجموعه ازمون 1420 کلمه ای، حدود 94% از کلمات به درستی طبقه بندی شدند.

استفاده از یادگیری استقرایی قوانین برای جداسازی تصویری کلمات فارسی و لاتین Keywords:

استفاده از یادگیری استقرایی قوانین برای جداسازی تصویری کلمات فارسی و لاتین authors

هادی صدوقی یزدی

دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، بخش مهندسی برق

مهدی آبادی

دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، بخش مهندسی برق

احسان اله کبیر

دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، بخش مهندسی برق

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
ه. صدوقی، ا. کبیر، "جداسازی تصویری کلمات فارسی از لاتین"، ...
J. Hochberg, L. Kerns, P. Kelly and T. Thomas, ، ...
J. Hochberg, K. Bowers, M. Cannon, and P. Kelly, ، ...
A. Spitz, *Script and Language D etermination from Document Images, ...
A.K. Jain and Y. Zhong, *Page Segmentation Using Texture Analysis' ...
T.N.Tan, ،Rotation Invariant Texture Features and Their Use in Automatic ...
J. G. Carbonell, *Paradigms for Machine Learning', Artificial Intelligence, 40(1-3): ...
J. Durkin, Expert Systems: Design and Development, Macmillan Publishing Company, ...
J.R. Quinlan, *Generating Production Rules from Decision Trees, Proc. _ ...
J.R. Quinlan, C4.5 Programs for Machine Learning, Morgan Kaufman Publishers, ...
نمایش کامل مراجع

مقاله فارسی "استفاده از یادگیری استقرایی قوانین برای جداسازی تصویری کلمات فارسی و لاتین" توسط هادی صدوقی یزدی، دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، بخش مهندسی برق؛ مهدی آبادی، دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، بخش مهندسی برق؛ احسان اله کبیر، دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، بخش مهندسی برق نوشته شده و در سال 1381 پس از تایید کمیته علمی هشتمین کنفرانس سالانه انجمن کامپیوتر ایران پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله بازشناسی متون چاپی ، متون چند زبانه ، جداسازی تصویری کلمات ، یادگیری استقرایی قوانین ، C4.5 هستند. این مقاله در تاریخ 18 بهمن 1386 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 1619 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که برای بازشناسی اسناد چند زبانه باید بتوان بهطور خودکار نوع زبان هر کلمه را تشخیص داد. در این مقاله، با استفاده از یادگیری استقرایی قوانین، روشی برای جداسازی تصویری کلمات فارسی و لاتین در متون چاپی ارائه میشود. در روش پیشنعادی از 6 ویژگی تصویری استفاده شده است. مجموعه ویژگی های استخراجشده از 896 نمونه آموزشی تصاویر کلمات فارسی و ... . برای دانلود فایل کامل مقاله استفاده از یادگیری استقرایی قوانین برای جداسازی تصویری کلمات فارسی و لاتین با 6 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.