استفاده ازترکیب شبکه های عصبی جهت دسته بندی متون فارسی مبتنی برالگوریتم های GA,KNN,PCA جهت کاهش ویژگی

مهدی برفامی; سهیل فاطری

استفاده ازترکیب شبکه های عصبی جهت دسته بندی متون فارسی مبتنی برالگوریتم های GA,KNN,PCA جهت کاهش ویژگی

Publish place: First National Conference on Advances in computer science and information retrieval approaches

Publish Year: 1392

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/225887

شناسه ملی سند علمی:

BPJ01_632

تاریخ نمایه سازی: 29 دی 1392

Abstract:

باافزایش حجم اطلاعات نیازفوق العاده به ابزارهایی که بتوانند درمدیریت منابع موثرباشند کاملا احساس میشود دسته بندی متون فرایندی است که درآن متن ها دریک یاچنددسته ازقبل تعریف شده براساس محتوا قرارمیگیرند دراین مقاله ازترکیب دوشبکه عصبی چندلایه پرسپترون MLP دردسته بندیمستندات نیمه ساختیافته XML برروی پایگاه داده روزنامه همشهری استفاده شده است البته برای دسته بندی مستندات انتخاب ویژگیهای مهم نقش بسزایی دارد لذا تمرکز بررویتکنیکهای پیش پردازش مستندات و به گونه ویژه روشهای وزندهی ویژگیهای مورد بررسی قرارگرفته و یکی ازروشها TFCRF برای وزن دهی به مستندات انتخاب شده است سپس به کمک روش تجزیه و تحلیل مولفه های اصلی PCA به ارزش دهی ویژگیها پرداخته و با الگوریتم KNN تعدادی ازآنها انتخاب شده و به عنوان ورودی یکی ازشبکه های عصبی استفاده میشود درمرحله بعد ازویژگیهای ارزش دهی شده به کمک الگوریتم GA تعدادی ویژگی انتخاب شده و به عنوان ورودی یکی دیگر ازشبکه های عصبی استفاده میشود سپس نتایج خروجی این دوشبکه به کمک جمع جبری بایکدیگر ترکیب شده درنهایت موردتست و ارزیابی قرارگرفته است نتایج بدست امده نشان میدهددسته بندیمتون بادقت بالایی انجام یافته است

Keywords:

استخراج ویژگی , دسته بندی متون , شبکه عصبی چندلایه پرسپترون , مستندات نیمه ساختیافته , وزن دهی ویژگی

Authors

مهدی برفامی

دانشگاه آزاد اسلامی بابل

سهیل فاطری

دانشگاه آزاد اسلامی بابل