سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

مقایسه روش های یادگیری ماشین در تحلیل داده های نامتوازن

Publish Year: 1402
Type: Conference paper
Language: Persian
View: 195

This Paper With 9 Page And PDF Format Ready To Download

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

Export:

Link to this Paper:

Document National Code:

NEEC07_074

Index date: 22 April 2024

مقایسه روش های یادگیری ماشین در تحلیل داده های نامتوازن abstract

داده ها نامتوازن، داده هایی هستند که توزیع کلاس ها در مجموعه داده ها یکنواخت نیست. به دلیل این که فراوانی برخی از کلاس ها پایین است ممکن است در روش های طبقه بندی جزء داده های پرت شناخته شود. این مطالعه به بررسی تکنیک های مدیریت داده های نامتوازن و همچنین تاثیر آن بر میزان صحت در طبقه بندی می پردازد. در این مطالعه از چندین الگوریتم یادگیری ماشین نظیر(جنگل تصادفی، درخت تصمیم، ماشین بردار پشتیبان، نزدیکترین همسایه، تقویت گرادیان درخت تصمیم تصادفی) استفاده شده است و برخورد این الگوریتم ها با داده های نامتوازن و متوازن مورد بررسی و آزمایش قرار گرفته است، همچنین لازم به ذکر است داده ها با دو روش بیش نمونه گیری و کم نمونه گیری متوازن شده اند و هر بار بصورت جداگانه به الگوریتم های یادگیری ماشین داده شده است و صحت الگوریتم ها و میزان F۱-Score مورد سنجش قرارگرفته است. علاوه برصحت الگوریتم در مواجه با داده های متوازن و نامتوازن دو روش متوازن کردن داده ها یعنی بیش نمونه گیری و کم نمونه گیری هم مورد ارزیابی قرارگرفته است، در نهایت الگوریتم جنگل تصادفی بالاترین صحت را برای داده های متوازن و نامتوازن بدست آورد، و همچنین متوازن کردن داده ها با روش بیش نمونه گیری تاثیر بالاتری در صحت نهایی الگوریتم را نشان می دهد. نتیجه نهایی این مطالعه را می توانید در قسمت ارزیابی و نتایج مشاهده نمایید.

مقایسه روش های یادگیری ماشین در تحلیل داده های نامتوازن Keywords:

مقایسه روش های یادگیری ماشین در تحلیل داده های نامتوازن authors

جواد نبیان

دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران

حمید رستگاری

استادیار، دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران

مقاله فارسی "مقایسه روش های یادگیری ماشین در تحلیل داده های نامتوازن" توسط جواد نبیان، دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران؛ حمید رستگاری، استادیار، دانشکده مهندسی کامپیوتر، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران نوشته شده و در سال 1402 پس از تایید کمیته علمی اولین کنفرانس بین المللی و هفتمین کنفرانس ملی مهندسی برق و سیستم های هوشمند پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله داده های متوازن ، داده های نامتوازن ، طبقه بندی ، یادگیری ماشین هستند. این مقاله در تاریخ 3 اردیبهشت 1403 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 195 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که داده ها نامتوازن، داده هایی هستند که توزیع کلاس ها در مجموعه داده ها یکنواخت نیست. به دلیل این که فراوانی برخی از کلاس ها پایین است ممکن است در روش های طبقه بندی جزء داده های پرت شناخته شود. این مطالعه به بررسی تکنیک های مدیریت داده های نامتوازن و همچنین تاثیر آن بر میزان صحت در طبقه بندی ... . این مقاله در دسته بندی موضوعی یادگیری ماشین طبقه بندی شده است. برای دانلود فایل کامل مقاله مقایسه روش های یادگیری ماشین در تحلیل داده های نامتوازن با 9 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.