CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

داده کاوی و رده بندی متون فارسی مبتنی بر الگوریتم بهینه سازی ازدحام ذرات (PSO) و بهینه سازی پارامترهای ماشین بردار پشتیبان (SVM)

عنوان مقاله: داده کاوی و رده بندی متون فارسی مبتنی بر الگوریتم بهینه سازی ازدحام ذرات (PSO) و بهینه سازی پارامترهای ماشین بردار پشتیبان (SVM)
شناسه ملی مقاله: ITCC01_147
منتشر شده در کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات در سال 1394
مشخصات نویسندگان مقاله:

رویا ولایتی - دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر
مرضیه دادور - دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

خلاصه مقاله:
داده کاوی و رده بندی متون می تواند اطلاعات فضای مجازی را در حداقل زمان طبقه بندی و زمینه فعالیت وب سایت ها وکاربران فضای مجازی را شناسایی و کنترل کند. در این روش برای رده بندی متن ها بطور معمول از کلمات متن به عنوانویژگی های آن متن استفاده می شود، با توجه به اینکه بعضی از ویژگی های انتخاب شده برای رده بندی متون مناسب نمی باشدو سبب افزایش خطا در رده بندی متون شده،به منظور داده کاوی، کاهش تعداد ویژگی ها ابتدا با استفاده از الگوریتم ژنتیک باتابع هدف حداقل خطای SVM ، ویژگی های بهینه را انتخاب و سپس این ویژگی ها به عنوان داده های آموزشی برای ردهبندی متون به ماشین بردار پشتیبان SVM چند لایه داده می شوند،در این روش یکی از عوامل موثر در افزایش کارایی SVMبهینه سازی پارامترها می باشد، برای این کار با استفاده از الگوریتم بهینه سازی ازدحام ذرات (PSO)، بهینه ترین مقدارپارامترهای ماشین بردار پشتیبان که سبب می شود خطای ردهبندی SVM به حداقل برسد جستجو و انتخاب می شوند. دادههای آموزشی که در این مقاله استفاده شده از روزنامه همشهری پیش پردازش می شوند، و در محیط Matlab پیاده سازیشده است.دراین روش که یکی از روشهای یادگیری با نظارت است اطلاعات را ازفضای حاضر به فضای برداری دیگریعموما با ابعاد بیشتر که در آن الگوریتم های یادگیری خطی قابل کاربرد است نگاشت می کند. که این روش می تواند با دقت93.5% عمل رده بندی را انجام دهد.

کلمات کلیدی:
رده بندی متون، الگوریتم ازدحام ذرات PSO ، بهینه سازی پارامترهای SVM ،داده کاوی، الگوریتم ژنتیک، هوش مصنوعی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/450935/