انتخاب بهینه ترین K برای دیتاست های موجود با استفاده از MLP-KFOLD

حسن, سهراب پور; مسعود, پورمرادی; مقداد, میردار موسی پور

انتخاب بهینه ترین K برای دیتاست های موجود با استفاده از MLP-KFOLD

عنوان مقاله: انتخاب بهینه ترین K برای دیتاست های موجود با استفاده از MLP-KFOLD
شناسه ملی مقاله: DPFSTS06_249
منتشر شده در ششمین کنگره بین المللی توسعه و ترویج علوم و فنون بنیادین در جامعه در سال 1397

مشخصات نویسندگان مقاله:

حسن سهراب پور - دانشکده سما چالوس ، چالوس
مسعود پورمرادی - دانشکده سما چالوس ، چالوس
مقداد میردار موسی پور - دانشگاه پویندگان، چالوس

خلاصه مقاله:

پیشرفت روز افزون تکنولوژی های جمع آوری اطلاعات و امکان دسترسی به حجم عظیمی از داده همواره نیازمند روش هایی برای تجزیه و تحلیل این حجم داده خام و استخراج اطلاعات مفید از آن می باشیم. امروزه خوشه بندی داده به عنوان یکی از روش های آنالیز و ساده سازی مجموعه داده های بزرگ، مورد توجه بسیاری از محققین قرار گرفته است. در این مقاله با استفاده از MLP-KFOLD داده ها مورد نظر را به تعداد K، که انتخاب K هم به اندازه تعداد داده های موجود یا همان دیتاست بستگی دارد. این نوع اعتبارسنجی داده ها به K زیرمجموعه افراز می شوند. از این K زیرمجموعه، هر بار یکی برای اعتبارسنجی و K-1 تای دیگر برای آموزش بکار می روند. این روال K بار تکرار می شود و همه داده ها دقیقا یکبار برای آموزش و یکبار برای اعتبارسنجی بکار می روند. در نهایت میانگین نتیجه این K بار اعتبارسنجی به عنوان یک تخمین نهایی برگزیده می شود. در روش K-Fold سعی می شود نسبت داده ای هر کلاس در هر زیرمجموعه و در مجموعه اصلی یکسان باشد.

کلمات کلیدی:

اعتبارسنجی، خوشه بندی، کلاسترینگ ، دسته بندی، K-Fold

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/916990/