اهمیت ترکیب روش های آماری و علوم رایانه ای در تحلیل داده های بزرگ

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 408

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCONFC01_054

تاریخ نمایه سازی: 13 مهر 1397

Abstract:

در دنیای پیشرفته ی امروزی، هر روز حجم بی سابقه ای از اطلاعات به طور مداوم و در اکثر زمینه ها ایجاد می شد. در بررسی این اطلاعات عظیم یا همان داده های بزرگ دو موضوع اولیه مطرح می گردد. یکی جمع آوری و ذخیره سازی داده ها می باشد و دیگری تجزیه و تحلیل داده ها است. توانایی در تجزیه و تحلیل و درک مجموعه ی داده های انبوه نسبت به توانایی در جمع آوری و ذخیره سازی داده ها از اهمیت بیشتری برخوردار است. توانایی در تفسیر و استفاده از تمامی این اطلاعات مزایای اقتصادی و اجتماعی در برداشته و سبب پیشرفت هایی در زمینه های مختلف و بهبود کیفیت خواهد شد. روش های تحلیل داده های بزرگ، روش های ترکیبی است که با کمک آمار و سایر رشته های وابسته به آن مانند داده کاوی، یادگیری ماشین، شبکه های عصبی، تحلیل شبکه های اجتماعی، پردازش سیگنال، تشخیص الگو، روش های بهینه سازی و تجسم رویکردها به راحتی اطلاعات نهفته ی مجموعه ای بسیار بزرگ از داده ها به دست آورده می شود. این روش ها، الگوها و تکنیک های متفاوتی از جمله رگرسیون، سری زمانیف ماشین های بردار پشتیبان، درخت تصمیم و ... هستند که هریک به فراخورد داده ها و کارایی مورد نظر باید انتخاب شوند. در این مقاله ضمن معرفی داده های بزرگ و ویژگی های آن روش های تحلیل این داده ها معرفی می گردد. در مثالی از تحقیق چانگ (2004)، مربوط به زایمان مادران، اهمیت و ترکیب روش های آماری (مدل سازی لگاریتم خطی) و نظریه یادگیری از علوم رایانه ای (درخت رده بندی رگرسیونی) برای دستیابی به اطلاعات بیشتر و کامل تر از یک مجموعه داده ی بزرگ تایید می گردد.

Keywords:

داده بزرگ , مدل سازی الگوریتم خطی , نظریه یادگیری , درخت رده بندی رگرسیونی

Authors

آسیه ابطحی

استادیار