استفاده ازترکیب شبکه های عصبی جهت دسته بندی متون فارسی مبتنی برالگوریتم های GA,KNN,PCA جهت کاهش ویژگی
Publish place: First National Conference on Advances in computer science and information retrieval approaches
Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 845
This Paper With 9 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ01_632
تاریخ نمایه سازی: 29 دی 1392
Abstract:
باافزایش حجم اطلاعات نیازفوق العاده به ابزارهایی که بتوانند درمدیریت منابع موثرباشند کاملا احساس میشود دسته بندی متون فرایندی است که درآن متن ها دریک یاچنددسته ازقبل تعریف شده براساس محتوا قرارمیگیرند دراین مقاله ازترکیب دوشبکه عصبی چندلایه پرسپترون MLP دردسته بندیمستندات نیمه ساختیافته XML برروی پایگاه داده روزنامه همشهری استفاده شده است البته برای دسته بندی مستندات انتخاب ویژگیهای مهم نقش بسزایی دارد لذا تمرکز بررویتکنیکهای پیش پردازش مستندات و به گونه ویژه روشهای وزندهی ویژگیهای مورد بررسی قرارگرفته و یکی ازروشها TFCRF برای وزن دهی به مستندات انتخاب شده است سپس به کمک روش تجزیه و تحلیل مولفه های اصلی PCA به ارزش دهی ویژگیها پرداخته و با الگوریتم KNN تعدادی ازآنها انتخاب شده و به عنوان ورودی یکی ازشبکه های عصبی استفاده میشود درمرحله بعد ازویژگیهای ارزش دهی شده به کمک الگوریتم GA تعدادی ویژگی انتخاب شده و به عنوان ورودی یکی دیگر ازشبکه های عصبی استفاده میشود سپس نتایج خروجی این دوشبکه به کمک جمع جبری بایکدیگر ترکیب شده درنهایت موردتست و ارزیابی قرارگرفته است نتایج بدست امده نشان میدهددسته بندیمتون بادقت بالایی انجام یافته است
Keywords:
استخراج ویژگی , دسته بندی متون , شبکه عصبی چندلایه پرسپترون , مستندات نیمه ساختیافته , وزن دهی ویژگی
Authors
مهدی برفامی
دانشگاه آزاد اسلامی بابل
سهیل فاطری
دانشگاه آزاد اسلامی بابل