انتخاب ویژگی در متون فارسی با استفاده از ترکیب الگوریتم های فراشناختی

لیلا, هاوشکی; محبوبه, شمسی; عبدالرضا, رسولی کناری

انتخاب ویژگی در متون فارسی با استفاده از ترکیب الگوریتم های فراشناختی

عنوان مقاله: انتخاب ویژگی در متون فارسی با استفاده از ترکیب الگوریتم های فراشناختی
شناسه ملی مقاله: DCBDP06_028
منتشر شده در ششمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ در سال 1399

مشخصات نویسندگان مقاله:

لیلا هاوشکی - دانشجوی کارشناسی ارشد نرم افزار، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم
محبوبه شمسی - استادیار، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم،
عبدالرضا رسولی کناری - استادیار، دانشکده برق و کامپیوتر، دانشگاه صنعتی قم

خلاصه مقاله:

انتخاب ویژگی به طور گسترده در زمینه ی متن کاو ی برای ایجاد یک مدل با تعداد ویژگی های کمتر استفاده می شود. انتخاب ویژگی متن یک گام مهم در طبق هبندی متن است و به طور مستقیم بر عملكرد آن تأثیر می گذارد. در این مقاله یک روش بهبود انتخاب ویژگی برای طبقه بندی داده های بزر گ 3با استفاده از ترکیب الگوریتم های فراشناختی پیشنهاد می شود. در این روش از ترکیب الگوریتمبهینه سازی ازدحام ذره ها براساس لینک و الگوریتم جست و جوی گرانشی استفاده می شود. الگوریتم بهینه سازی ازدحام ذره ها بر اساس لینک، بهبودی از الگوریتم بهینه سازی ازدحام ذره ها است. در این پژوهش برای افزایش توان جست و جوی محلی این الگوریتم از الگوریتم جست و جوی گرانشی استفاده می شود. براساس ویژگ یهای انتخاب شده، مدل طبقه بندیِ کلاس بند نزدیک ترین همسایه ساخته می شود. در آخر نتایج بر اساس معیار ارزیابی مورد بررسی قرار می گیرد . عملكرد الگوریتم پیشنهادی بر روی مجموعه داده همشهری مورد بررسی قرار گرفته است. این مجموعه داده با استفاده از کتابخانه هضم پیش پردازش شده است و دو مجموعه داده تصادفی ایجاد شده است . نتایج ما نشان می دهد که روش پیشنهادی با انتخاب تعداد ویژگی کمتر در دو مجموعه داده تولید شده به ترتیب به افزایش دقت 97 / 3 % و 58 / 1 % رسیده است .

کلمات کلیدی:

انتخاب ویژگی، داده های بزرگ، الگوریتم جست و جوی گرانشی، الگوریتم بهینه سازی ازدحام ذره ها، متن کاوی، پیش پردازش متن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1167815/