استفاده ازترکیب شبکه های عصبی جهت دسته بندی متون فارسی مبتنی برالگوریتم های GA,KNN,PCA جهت کاهش ویژگی

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 845

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

BPJ01_632

تاریخ نمایه سازی: 29 دی 1392

Abstract:

باافزایش حجم اطلاعات نیازفوق العاده به ابزارهایی که بتوانند درمدیریت منابع موثرباشند کاملا احساس میشود دسته بندی متون فرایندی است که درآن متن ها دریک یاچنددسته ازقبل تعریف شده براساس محتوا قرارمیگیرند دراین مقاله ازترکیب دوشبکه عصبی چندلایه پرسپترون MLP دردسته بندیمستندات نیمه ساختیافته XML برروی پایگاه داده روزنامه همشهری استفاده شده است البته برای دسته بندی مستندات انتخاب ویژگیهای مهم نقش بسزایی دارد لذا تمرکز بررویتکنیکهای پیش پردازش مستندات و به گونه ویژه روشهای وزندهی ویژگیهای مورد بررسی قرارگرفته و یکی ازروشها TFCRF برای وزن دهی به مستندات انتخاب شده است سپس به کمک روش تجزیه و تحلیل مولفه های اصلی PCA به ارزش دهی ویژگیها پرداخته و با الگوریتم KNN تعدادی ازآنها انتخاب شده و به عنوان ورودی یکی ازشبکه های عصبی استفاده میشود درمرحله بعد ازویژگیهای ارزش دهی شده به کمک الگوریتم GA تعدادی ویژگی انتخاب شده و به عنوان ورودی یکی دیگر ازشبکه های عصبی استفاده میشود سپس نتایج خروجی این دوشبکه به کمک جمع جبری بایکدیگر ترکیب شده درنهایت موردتست و ارزیابی قرارگرفته است نتایج بدست امده نشان میدهددسته بندیمتون بادقت بالایی انجام یافته است

Authors

مهدی برفامی

دانشگاه آزاد اسلامی بابل

سهیل فاطری

دانشگاه آزاد اسلامی بابل