روش ترکیبی مبتنی بر ماشین بردار پشتیبان با الگوریتم بهینه سازی کلاغ برای دسته بندی متون

Publish Year: 1404
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 16

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

TSTACON02_100

تاریخ نمایه سازی: 26 بهمن 1404

Abstract:

امروزه دستیابی به انواع منابع کتابخانه ای در اینترنت فراهم شده است. اما مشکلی که وجود دارد طبقه بندی اسناد در میان حجم انبوهی از داده ها است. بدون طبقه بندی، زمان دسترسی به اسناد مورد نظر زمان بر و خطا خواهد بود. مسئله ی مهم دیگر در طبقه بندی اسناد متنی استفاده از الگوریتم های بهینه و هوشمند در طبقه بندی است. باید الگوریتم هایی را بکار گرفت که در انتخاب ویژگی و استخراج کلمات توانایی بالقوه ای داشته باشند. این مقاله یک چارچوب طبقه بندی متن ترکیبی را با ادغام ماشین بردار پشتیبان با الگوریتم جستجوی کلاغ برای انتخاب ویژگی بهینه پیشنهاد می کند؛ همچنین برای شمارش و فراوانی کلمات از تکنیک TF استفاده شده است. ارزیابی بر روی سه مجموعه داده Reuters-۲۱۵۷، WebKB، Cade۱۲ انجام شده است. نتایج نشان داد که مدل پیشنهادی در مقایسه با ماشین بردار پشتیبان طبقه بندی بالاتری دارد و اینکه در مقایسه با مدل های کا نزدیک ترین همسایه و C۴.۵ در بیشتر موارد مقدار F-Measure در مدل پیشنهادی بیشتر است و همچنین با انتخاب ویژگی مدل پیشنهادی توانسته است دقت طبقه بندی را تا حدود ۲۷ درصد در مقایسه با ماشین بردار پشتیبان افزایش دهد.

Keywords:

طبقه بندی اسناد متنی , ماشین بردار پشتیبان , الگوریتم بهینه سازی کلاغ

Authors

علیزاده آیسودا

گروه مهندسی کامپیوتر، واحد ارومیه دانشگاه آزاد اسلامی، ارومیه، ایران

فرهاد سلیمانیان قره چپق

گروه مهندسی کامپیوتر واحد ارومیه دانشگاه آزاد اسلامی، ارومیه، ایران