بهبود یک روش مبتنی برانتخاب ویژگی به منظور دسته بندی متون با الگوریتم های متن کاوی
Publish place: The Second National Congress of New Technologies of Iran with the aim of achieving sustainable development
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,000
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SENACONF02_095
تاریخ نمایه سازی: 30 آبان 1394
Abstract:
یکی از مهمترین تکنیک های متنکاوی، دسته بندی متون است. متن کاوی را میتوان به عنوان متدها و الگوریتم هایی از فیلدهای یادگیری ماشین و آماری برای متنها با هدف پیدا کردن الگوهای مفید در نظرگرفت. برای این هدف پیش پردازش کردن متون ضروری است. در بسیاری از روشها، متدهای استخراج اطلاعات، پردازش کردن زبان طبیعی یا برخی پیش پردازشهای ساده برای استخراج داده از متون استفاده می شود. سپس می توان الگوریتم های داده کاوی را بر روی داده های استخراج شده اعمال کرد دسته بندی متون بدین معنی است که اسناد متنی موجود را به چند دسته از قبل تعریف شده که اسناد متعلق به آنها هستند، نسبت دهیم. دادههای ذخیره شده در بیشتر پایگاه داده های متنی، داده های نیمه ساختار یافته هستند چون نه به طور کامل غیرساخت یافته هستند و نه به طور کامل ساختیافته هستند. الگوریتم انتخاب ویژگی فیلتری، جهت کاهش پیچیدگی دسته بندی در قسمت پیش پردازش مورد استفاده قرار گرفته است و در قسمت یادگیری الگوریتم یادگیری بیز ساده، درخت تصمیم و ماشین بردار پشتیبان جهت ارزیابی و بهبود کارایی استفاده نموده ایم .
Keywords:
Authors
عارف سیاحی
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سید محسن هاشمی
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سعید مزرعه
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :