دسته بندی داده های بزرگ با استفاده از الگوریتم جنگل تصادفی
Publish place: The 4th International Conference on Science & Technology with Sustainable development approach
Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 424
This Paper With 10 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
TECHSD04_036
تاریخ نمایه سازی: 31 تیر 1398
Abstract:
امروزه فرایند استخراج اطلاعات معتبر ناشناخته، قابل فهم و قابل اعتماد از مجموعه داده های بزرگ و استفاده از آن در تصمیم گیری ودر فعالیت های تجاری بیشتر از گذشته احساس می شود. از این رو لازم برای تحلیل داده ها مصنوعی و کشف الگوی نا شناخته معتبر و روابط بین مجموعه های داده وسیع می باش. این ابزار ها می تواند شامل مدل های آماری و الگوریتم های ریاضی و روش یادگیری ماشین باشد. با استفاده از این الگوریتم ها در مباحث مختلف صنعتی ، مدیریتی ،مالی ، مهندسی منجر به پیشرفت سازمان ها در تحلیل داده های وسیع شده است و با توجه به هدف اصلی طبقه بدی داده ها رسیدن به صحت بالاست و یکی از متدها برای رسیدن به این هد استفاده از یادگیری تلفیقی است . جنگل تصادفی به عنوان درخت تصمیم تلفیقی محسوب می شودو کارایی خوبی هم در طبقه بندی داده ها کلان دارد. طبقه بندی مجموعه داده های نامتعادل چالشی را برای اکثر تکنیک های یادگیری استاندارد به وجود آورده است و الوریتم جنگل تصادفی هم تحت تاثیر منفی توزیع کلاس نا متعادل قرار گرفته است ودر نهایت کار طبقه بندی این داده ها را به کمک الگوریتم جنگل تصادفی انجام داده ایم.
Keywords:
Authors
بهمن فرجی فیجانی
دانشگاه آزاد اسلامی واحد ساوه ، ساوه
مریم رستگارپور
دانشگاه آزاد اسلامی واحد ساوه ، ساوه