طبقه بندی خودکار متون با استفاده از خوشه بندی فازی بهبود یافته و استخراج ویژگی های مبتنی بر الگوریتم ژنتیک

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 466

This Paper With 8 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI22_045

تاریخ نمایه سازی: 13 شهریور 1396

Abstract:

با ورود به عصر اطلاع رسانی دیجیتال و رشد سریع اینترنت، رفته رفته اطلاعات از فرم کاغذی به الکترونیکی تبدیل شدند. این امر برای ما امکان جستجوی کتاب ها و اخبار را به صورت الکترونیکی فراهم می کند. بنابراین نیاز به سیستم هایی برای بازیابی اطلاعات احساس می شود. به این منظور سیستمی جهت طبقه بندی متون با استفاده از خوشه بندی فازی با بردار ویژگی وزن دارپیشنهاد می-شود. در روش پیشنهادی ابتدا در مرحله ی پیش پردازش، برای کاهش ابعاد از الگوریتم ژنتیک و سپس TF-IDF (Term Frequency - Inverse Document Frequency) استفاده شده و ویژگی هایی با قدرت تفکیک بالا انتخاب می شوند. سپس ماتریس وزنی متناسب با واریانس هر ویژگی، محاسبه شده و همگام با پیشرفت الگوریتم خوشه بندی تغییر می کند. بنابراین ویژگی های با واریانس بیشتر، تاثیر بیشتری در فرایند خوشه بندی خواهند داشت. در روش خوشه بندی، فاصله اقلیدسی به کار رفته، با این تفاوت که برای ابعاد ارزش یکسانی در نظر گرفته نمی شود. در نهایت کارایی سیستم پیشنهادی در خوشه بندی گروه های خبری مجموعه داده رویترز بررسی شده و نتایج نشان دهنده ی کارایی بالاتر این روش نسبت به خوشه بندی معمولی از نظر چند معیار ارزیابی معروف خوشه-بندی، است.

Keywords:

Authors

سهیلا رمضانی پور

دانشجوی کارشناسی ارشد، گروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه شهید چمران اهواز، اهواز

مرجان نادران طحان

استادیار گروه کامپیوتر، دانشکده مهندسی، دانشگاه شهید چمران اهواز، اهواز

سعیدالله مرتضوی

دانشیار گروه برق و کنترل، دانشکده مهندسی، دانشگاه شهید چمران اهواز، اهواز