داده کاوی و رده بندی متون فارسی مبتنی بر الگوریتم بهینه سازی ازدحام ذرات (PSO) و بهینه سازی پارامترهای ماشین بردار پشتیبان (SVM)

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,385

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCC01_147

تاریخ نمایه سازی: 9 فروردین 1395

Abstract:

داده کاوی و رده بندی متون می تواند اطلاعات فضای مجازی را در حداقل زمان طبقه بندی و زمینه فعالیت وب سایت ها وکاربران فضای مجازی را شناسایی و کنترل کند. در این روش برای رده بندی متن ها بطور معمول از کلمات متن به عنوانویژگی های آن متن استفاده می شود، با توجه به اینکه بعضی از ویژگی های انتخاب شده برای رده بندی متون مناسب نمی باشدو سبب افزایش خطا در رده بندی متون شده،به منظور داده کاوی، کاهش تعداد ویژگی ها ابتدا با استفاده از الگوریتم ژنتیک باتابع هدف حداقل خطای SVM ، ویژگی های بهینه را انتخاب و سپس این ویژگی ها به عنوان داده های آموزشی برای ردهبندی متون به ماشین بردار پشتیبان SVM چند لایه داده می شوند،در این روش یکی از عوامل موثر در افزایش کارایی SVMبهینه سازی پارامترها می باشد، برای این کار با استفاده از الگوریتم بهینه سازی ازدحام ذرات (PSO)، بهینه ترین مقدارپارامترهای ماشین بردار پشتیبان که سبب می شود خطای ردهبندی SVM به حداقل برسد جستجو و انتخاب می شوند. دادههای آموزشی که در این مقاله استفاده شده از روزنامه همشهری پیش پردازش می شوند، و در محیط Matlab پیاده سازیشده است.دراین روش که یکی از روشهای یادگیری با نظارت است اطلاعات را ازفضای حاضر به فضای برداری دیگریعموما با ابعاد بیشتر که در آن الگوریتم های یادگیری خطی قابل کاربرد است نگاشت می کند. که این روش می تواند با دقت93.5% عمل رده بندی را انجام دهد.

Keywords:

رده بندی متون , الگوریتم ازدحام ذرات PSO , بهینه سازی پارامترهای SVM , داده کاوی , الگوریتم ژنتیک , هوش مصنوعی

Authors

رویا ولایتی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

مرضیه دادور

دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Barari. L., Analoie. M. and Garmeh.M., "Machin Learning Methods for ...
  • EhsanDarrudi, Mohammad Reza Hejazi, FarhadOrou mchian, Assessment of a Modern ...
  • Egghe, L. (2000). "The distribution of N-gra ms" _ Sci ...
  • Baeza-Yates, R., &Ri beiro-Neto, B. (1999). Chapter 3 Retrieval evaluation.In ...
  • Khreisat L, , 2009, "A machine learning approach for Arabic ...
  • Bina. B., Rahgozar. M. and Dehmobed. A., "Automatic Persian Text ...
  • Basiri. M. A., Nemati. Sh. and G hasemaghaie. N., "A ...
  • Maghsoodi. N. and Homayoon pour. M. M., "A Novel Method ...
  • T. Joachims. Text categorization with support vector machines: learning with ...
  • Sa ndipa nCha kro borty, Gouta mSaha, Feature selection using ...
  • Hu Gua na, J ingyuZhoua, BinXiaob, MinyiG uoa, TaoYa ngc, ...
  • نمایش کامل مراجع