دسته بندی متون فارسی بااستفاده ازترکیب خبره ها وبهره گیری ازروشهای GA,LDA,PCA جهت کاهش ویژگی
Publish place: 12th Iranian Conference on Intelligent Systems
Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 490
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICS12_050
تاریخ نمایه سازی: 11 مرداد 1393
Abstract:
باافزایش حجم اطلاعات نیازبه ابزارهایی که بتواننددرمدیریت منابع موثرباشند کاملا احساس میشود دسته بندی متون فرایندی است که درآن متن ها دریک یاچند دسته ازقبل تعریف شده براساس محتوا قرارمیگیرند دراین مقاله ازترکیب خبره ها بطور خاص شبکه عصبی دردسته بندی مستندات نیمه ساختیافته XML برروی پایگاه داده روزنامه همشهری استفاده شدها ست البته برای دسته بندی مستندات انتخاب ویژگیهای مهم نقش بسزایی دارد لذا تمرکز بررویتکنیک های پیش پردازش و به گونه ویژه روش های وزن دهی ویژگی مورد بررسی قرارگرفته و یکی ازروشها برای وزن دهی به مستندات انتخاب شده است سپس به کمک روش تجزیه و تحلیل مولفه های اصلی به ارزش دهی ویژگیها پرداخته و با الگوریتم نزدیکترین همسایگی تعدادی ازآنها انتخاب و به عنوان ورودی یکی ازخبره ها استفاده میشود درمرحله بعدازویژگیهای ارزش دهی شده یک باربه کمک الگوریتم جداکننده خطی و باردیگر به کمک الگوریتم ژنتیک تعدادی ویژگی انتخاب وبطور مجزا به عنوان ورودی به خبره ها اعمال میشود سپس نتایج خروجی این سه خبره بایکدیگرترکیب شده درنهایت موردتست وارزیابی قرارمیگیرد نتایج بدست امده نشان میدهد دسته بندی متون بادقت بالایی انجام گرفته است
Keywords:
استخراج ویژگی , دسته بندی متون , شبکه عصبی چندلایه پرسپترون , مستندات نیمه ساختیافته , وزن دهی ویژگی
Authors
مهدی برفامی
گروه مهندسی کامپیوتردانشگاه آزاد اسلامی واحد بابل
سهیل فاطری
گروه مهندسی کامپیوتردانشگاه آزاد اسلامی واحد بابل
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :