روش جدید انتخاب ویژگی برای طبقه بندی اسناد فارسی با استفاده از الگوریتم های فراابتکاری

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 603

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

DCBDP05_084

تاریخ نمایه سازی: 6 آذر 1398

Abstract:

امروزه با افزایش روزافزون اطلاعات و گستردگی موضوعات دادهکاوی یکی از موضوعات مهم درزمینهی پردازش انبوه اطلاعات است. متن کاوی شاخه ایی از داده کاوی است که در آنها متون در دسته ها یا گروه هایی قرار میگیرند. دسته بندی متون یکی از مواردی است که اخیرا موردتوجه جوامع علمی قرارگرفته است و کاربردهای بسیاری دارد از جمله مهمترین آنها، فیلترکردن پیامهای ورودی نرم افزارهای پیام رسان مانند سروش و آی گپ میباشد. دسته بندی متون فرایندی است که در آن متون براساس وزن کلمات، که یکی از نکات مهم در افزایش دقت و کارایی الگوریتمهای دسته بندی است، در دسته هایی، قرار میگیرند. در این پژوهش، روشی برای دسته بندی متون فارسی با استفاده از ضریب همبستگی پیرسون به همراه روش جدید وزندهی Var-TFIDF و الگوریتم فراابتکاری بهینه سازی انبوه ذرات (PSO) جهت انتخاب ویژگی بهتر، ارائه شده است. برای شبیه سازی از نرم افزار متلب به همراه داده های روزنامه همشهری استفاده شده است، نتایج آزمایشها نشان داد که روش جدید وزندهی به همراه استفاده از الگوریتم فراابتکاری نسبت به سایر روشها دارای دقت بالاتری میباشد.

Authors

پیمان فضلی

کارشناسی ارشد نرم افزار، دانشگاه آزاد اسلامی، میاندوآب، ایران

عادل رضایی

هیات علمی گروه کامپیوتر، دانشگاه آزاد اسلامی، میاندوآب، ایران