CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یادگیری داده های نامتوازن توسط ترکیبی از الگوریتم های طبقه بندی و خوشه بندی مبتنی بر سیستم فازی قانون محور

عنوان مقاله: یادگیری داده های نامتوازن توسط ترکیبی از الگوریتم های طبقه بندی و خوشه بندی مبتنی بر سیستم فازی قانون محور
شناسه ملی مقاله: GERMANCONF01_179
منتشر شده در کنگره بین المللی علوم و مهندسی در سال 1396
مشخصات نویسندگان مقاله:

مهدی امیرآبادی - دانشجوی کارشناسی ارشد گروه مهندسی کامپیوتر، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران
کاظم نیک فرجام - دکترای کامپیوتر، گروه مهندسی کامپیوتر، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران
مجیدرضا ناصح - دکترای برق، گروه مهندسی برق، واحد بیرجند، دانشگاه آزاد اسلامی، بیرجند، ایران

خلاصه مقاله:
مسیله مهمی که در استفاده از الگوریتم هاط طبقه بندی در حوزه های مختلف، صحت مدل هایی را که محققان ارایه می کنند به چالش می کشد. مسیله نامتوازن بودن مجموعه داده ها است. مسیله نامتوازن بودن داده ها زمانی رخ می دهد که تعداد نمونه های طبقات مختلف متغیر کلاس با هم برابر نبوده و اختلافشان زیاد باشد. در چنین مواقعی نتایج حاصل از الگوریتم های طبقه بندی استاندارد مورد اعتماد نمی باشد. امروزه تحقیقات فراوانی در این زمینه صورت گرفته است. در این مقاله قصد داریم رویکردی جدید جهت یادگیری داده های نامتوازن مبتنی بر سیستم فازی قانون محور ارایه نماییم. در رویکرد پیشنهادی ابتدا توسط تکنیک خوشه بندی داده های تویزی شناسایی شده تا از آنها در فرآیند یادگیری استفاده نشود. سپس مجموعه داده ها توسط تکنیک دیگری خ وشه بندی و داده های هر خوشه متوازن شده و به ازای هر خوشه، مدل یادگیر ساخته می شود. در مرحله دوم وزن هر مدل یادگیر توسط سیستم فازی قانون محور تعیین می گردد. در نهایت برای تجمع نتایج اگر وزن مدل یادگیر در محدوده قابلیت اطمینان باشد داده های آن خوشه توسط مدل یادگیر همان خوشه طبقه بندی می شوند وگرنه از سیستم رای گیری اکثریت وزن دار مبتنی بر الگوریتم Adaboost استفاده می شود. برای انجام ارزیابی، روش پیشنهادی به همراه هفت روش طبقه بندی استاندارد بر روی هشت دیتاست نامتوازن استاندارد اجرا شده است و شش معیار ارزیابی متداول شامل صحت، حساسیت، وضوح، دقت، F-measure و G-mean برای ارزیابی این روش ها مورد استفاده قرار گرفته است.

کلمات کلیدی:
الگوریتم طبقه بندی، داده کاوی، داده های نامتوازن، روش های ترکیبی، سیستم فازی قانون محور، یادگیری ماشین

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/755403/