انتخاب متغیر در داده های بزرگ

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 538

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CSCG01_126

تاریخ نمایه سازی: 29 مهر 1396

Abstract:

فناوری های نوین، داده های حجیمی را در بعد بالا تولید می کنند که مسیله تحلیل آنها موجب ابداع روش های جدید آماری و یادگیری ماشین شده است. قبل از اعمال بسیاری از این روش ها، معمول است که بعد داده های اصلی توسط روش هایی نظیر تحلیل مولفه های اصلی، رده بندی های درخت تصمیم، لاسو و غیره کاهش داده شده و متغیرهای موثر شناسایی شوند؛ اما در مواجهه با داده های بزرگ در بعد بالا، بسیاری از این روش ها به دلیل حجم و پیچیدگی محاسباتی قابل اجرا نیستند؛ بنابرین نیاز به الگوریتم های کار آمد است. در این تحقیق، با به کارگیری رویکرد غربال گری مستقل مطمین ابتدا متغیرهای موثر شناسایی شده سپس با این مجموعه متغیرها، عملکرد چهار روش رده بندی؛ تحلیل ممیزی خطی، تحلیل ممیزی درجه دوم، 1– نزدیک ترین همسایگی و رگرسیون لجستیک برای یک داده واقعی بررسی شده و نتایج باهم مقایسه شده اند.

Authors

سعید محمدی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود

داود شاهسونی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود

حسین باغیشنی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود