CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

انتخاب ویژگی گروهی با رویکرد تصمیم گیری چندمعیاره به منظور دسته بندی متون

عنوان مقاله: انتخاب ویژگی گروهی با رویکرد تصمیم گیری چندمعیاره به منظور دسته بندی متون
شناسه ملی مقاله: CSCG05_072
منتشر شده در پنجمین کنفرانس بین المللی محاسبات نرم در سال 1402
مشخصات نویسندگان مقاله:

فاطمه زریسفی کرمانی - استادیار، دانشگاه جیرفت

خلاصه مقاله:
دسته بندی متن از ابعاد بالا و پراکندگی زیاد فضای ویژگی رنج می برد. به همین دلیل، انتخاب ویژگی به عنوان مرحله مهمی از پیش پردازش در حوزه متن کاوی و به ویژه دسته بندی متن شناخته می شود. اخیرا رویکرد جدیدی به نام انتخاب ویژگی گروهی معرفی شده است که در آن، خروجی چندین روش انتخاب ویژگی برای به دست آوردن زیرمجموعه ی نهایی از ویژگی ها تجمیع می شوند. ادعا می شود که اصل "خرد جمعی" در بحث انتخاب ویژگی نیز می تواند منجربه انتخاب ویژگی قوی تر و پایدارتر هنگام برخورد با داده هایی با ابعاد بالا گردد. بنابراین در این کار، برای اولین بار از رویکرد انتخاب ویژگی گروهی در فاز آماده سازی داده های متنی، به منظور دسته بندی دقیق تر اسناد استفاده شده است. بطوریکه ابتدا مجموعه ی ویژگی ها با استفاده از ۴ روش انتخاب ویژگی مبتنی بر فیلتر بصورت جداگانه رتبه بندی شده، سپس فرآیند تجمیع نتایج حاصله و رتبه بندی نهایی ویژگی ها بعنوان یک مسئله ی تصمیم گیری چندمعیاره فرموله و به کمک تکنیک بیشترین بیشترین ها حل می شود. به منظور اثبات ادعا، کارآمدی روش انتخاب ویژگی پیشنهادی در دسته بندی موضوعی مجموعه داده متنی رویترز، با استفاده از الگوریتم های دسته بندی بیزین ساده چندجمله ای و k-همسایه نزدیک براساس معیارهای دقت و F-score مورد ارزیابی قرار گرفته است. مقایسه ی نتایج، نشان دهنده ی افزایش حداقل ۱درصدی و حداکثر ۱۰ درصدی دقت دسته بندی نسبت به ۴روش انتخاب ویژگی مبتنی بر فیلتر و ۳ روش ساده تجمیع در استراتژی ناهمگن می باشد.

کلمات کلیدی:
دسته بندی متن،انتخاب ویژگی گروهی،تصمیم گیری چندمعیاره،دسته بند بیزین ساده چندجمله ای،دسته بند k،همسایه نزدیک

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1966928/