دسته بندی داده های بزرگ با استفاده از الگوریتم جنگل تصادفی

بهمن فرجی فیجانی; مریم رستگارپور

دسته بندی داده های بزرگ با استفاده از الگوریتم جنگل تصادفی

Publish place: The 4th International Conference on Science & Technology with Sustainable development approach

Publish Year: 1397

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 10 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/900533

شناسه ملی سند علمی:

TECHSD04_036

تاریخ نمایه سازی: 31 تیر 1398

Abstract:

امروزه فرایند استخراج اطلاعات معتبر ناشناخته، قابل فهم و قابل اعتماد از مجموعه داده های بزرگ و استفاده از آن در تصمیم گیری ودر فعالیت های تجاری بیشتر از گذشته احساس می شود. از این رو لازم برای تحلیل داده ها مصنوعی و کشف الگوی نا شناخته معتبر و روابط بین مجموعه های داده وسیع می باش. این ابزار ها می تواند شامل مدل های آماری و الگوریتم های ریاضی و روش یادگیری ماشین باشد. با استفاده از این الگوریتم ها در مباحث مختلف صنعتی ، مدیریتی ،مالی ، مهندسی منجر به پیشرفت سازمان ها در تحلیل داده های وسیع شده است و با توجه به هدف اصلی طبقه بدی داده ها رسیدن به صحت بالاست و یکی از متدها برای رسیدن به این هد استفاده از یادگیری تلفیقی است . جنگل تصادفی به عنوان درخت تصمیم تلفیقی محسوب می شودو کارایی خوبی هم در طبقه بندی داده ها کلان دارد. طبقه بندی مجموعه داده های نامتعادل چالشی را برای اکثر تکنیک های یادگیری استاندارد به وجود آورده است و الوریتم جنگل تصادفی هم تحت تاثیر منفی توزیع کلاس نا متعادل قرار گرفته است ودر نهایت کار طبقه بندی این داده ها را به کمک الگوریتم جنگل تصادفی انجام داده ایم.

Keywords:

جنگل تصادفی , کلان داده ها , کارایی , نا متعادل , موازی سازی

Authors

بهمن فرجی فیجانی

دانشگاه آزاد اسلامی واحد ساوه ، ساوه

مریم رستگارپور

دانشگاه آزاد اسلامی واحد ساوه ، ساوه