روشی جدید در انتخاب ویژگی برای دسته بندی مستندات متنی

هاجر فرهمند; علی هارون آبادی; سید جواد میرعابدینی

روشی جدید در انتخاب ویژگی برای دسته بندی مستندات متنی

Publish place: The first regional conference on optimization and soft computing methods in electrical and computer engineering

Publish Year: 1392

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 7 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری ماشین

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/261650

شناسه ملی سند علمی:

ELECOM01_102

تاریخ نمایه سازی: 9 تیر 1393

Abstract:

امروزه اطلاعات زیادی در قالب متون الکترونیکی و پایگاه های داده ای متنی ذخیره شده اند. برای استخراج دانش از این حجم بالای اطلاعات متنی، نیازمند استفاده از روش های خوشه بندی و طبقه بندی مستندات متنی هستیم. در اکثر روشهای طبقه بندی متن معمولا براساس فراوانی کلمات و در نظر گرفتن متن به صورت مجموعه ای از کلمات، طبقه بندی انجام می شود ولی چنین نمایشی باعث ابعاد بالای متون، تعداد بسیار زیاد ویژگی ها و منجر به کاهش کارایی الگوریتم های طبقه بندی می گردد. در این مقاله به منظور کاهش تعداد ویژگی ها و انتخاب ویژگی های اصلی متن، از دانش پس زمینه و تکنیکهای یادگیری ماشین استفاده شده است. در واقع با استفاده از هستان شناس وردنت و دانش پس زمینه ویژگی های اصلی متون انتخاب می شوند و با استفاده از الگویتم های یادگیری ماشین متون طبقه بندی می شوند. نتایج شبیه سازی روش پیشنهادی، نشان می دهد بهبود موثری در کاهش ابعاد متن و در نتیجه افزایش کارایی طبقه بندی متن ایجاد شده است.

Keywords:

انتخاب ویژگی , طبقه بندی متن , هستان شناسی , یادگیری ماشین

Authors

هاجر فرهمند

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

علی هارون آبادی

استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر

سید جواد میرعابدینی

استادیار و عضو هیئت علمی، دانشگاه آزاد اسلامی واحد تهران مرکزی گروه کامپیوتر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

D.D. Lewis, Y. Yang, T. Rose, F. Li, :RCV1: A ...
A. Hotho, S. Staab, G. Stumme, "Ontologies Improve Text Clustering", ...
_ _ and representatios for text categorization", in Proc. 7th ...
A. McCallum, K. Nigam, "A comparison of event models for ...
_ _ _ and extention of RELLIEF, in Proc. 6th ...
T. Wang; H. Chiang, "Fuzzy support vector machine for multi- ...
_ _ _ _ Springer _ ...
C. Cardie, "Using decision tree to improve case based learning, ...
H. Schutze, D. Hull, J. O. Pedersen, "A comparison of ...
Verlag, Heidelberg, Pages 188, 1995-200, ...
_ _ _ _ Analysis and Information Retrieval, pp. 317-332, ...
_ _ _ _ _ _ [13] _ _ 2006. ...
Y. Yang, J.P. Pedersen, _ Comparative Study on Feature Selection ...
Y. Yang, X. Liu, _ Re-examination of Text Categorization Methods", ...
D. Bracewell, F. Ren, S. Kuroiwa, "Mulilingual Single Document Keyword ...
T. Joachims, :-Text Categorization with Support Vector Machines: ...
Z. Zheng, R. Srihari, "Optimally Combining Positive and Negative Features ...

نمایش کامل مراجع