دسته بندی اسناد متنی با استفاده از شبکه های عصبی پرسپترون چند لایه

Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 4,060

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IDMC02_150

تاریخ نمایه سازی: 14 فروردین 1388

Abstract:

با گسترش روز افزون حجم متون الکترونیکی، استفاده از روش های دسته بندی اسناد متنی، به یک مسئل هی ضروری تبدیل گشته است. در این مقاله روش های مختلف انتخاب ویژگی جهت کاهش ابعاد بالای فضای ویژگی در مسئل هی دسته بندی اسناد متنی بررسی شده است. این رو شها عبارتند از: بسامد سند، بهره اطلاعات، اطلاعات متقابل، آزمون χ2 و روش پیشنهادی بسامد سندموضوعی. به این ترتیب مشکل مربوط به استفاده از شبکه های عصبی پرسپترون چند لایه (MLP) برای دسته بندی متون، یعنی ابعاد بالای فضای ویژگی، با استفاده از رو شهای گوناگون حل شده است. بهترین نتایج با استفاده از روش کم هزینه اما موثر بسامد سند موضوعی حاصل شده است. همچنین شبکه های عصبی MLP معمولی و باینری، برای دسته بندی متون مورد آزمایش قرار گرفتهاند. بر مبنای این ایده که برای تعیین دسته ی یک متن می توان از اطلاعات مربوط به عضویت آن در سایر دسته ها استفاده نمود، با استفاده از یک شبکه ی ترکیب کننده ی نتایج، میانگین دقت الگوریتم دسته بندی بهبود یافته است. نتایج نشان می دهد استفاده از شبکه های عصبی MLP باینری به علاوه ی یک شبکه عصبی MLP ترکیب کننده ی نتایج، بالاترین میانگین دقت را دربین روش های مورد بررسی دارد و با کاهش 99 درصدی فضای ویژگی، میانگین دقت 91 درصدی در مسئله دسته بندی متون، حاصل می نماید

Keywords:

دسته بندی متون , شبکه های عصبی , کاهش ابعاد فضای ویژگی , رو شهای انتخاب ویژگی