انتخاب متغیر در داده های بزرگ
Publish place: 1st National Conference on Soft Computing
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 538
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSCG01_126
تاریخ نمایه سازی: 29 مهر 1396
Abstract:
فناوری های نوین، داده های حجیمی را در بعد بالا تولید می کنند که مسیله تحلیل آنها موجب ابداع روش های جدید آماری و یادگیری ماشین شده است. قبل از اعمال بسیاری از این روش ها، معمول است که بعد داده های اصلی توسط روش هایی نظیر تحلیل مولفه های اصلی، رده بندی های درخت تصمیم، لاسو و غیره کاهش داده شده و متغیرهای موثر شناسایی شوند؛ اما در مواجهه با داده های بزرگ در بعد بالا، بسیاری از این روش ها به دلیل حجم و پیچیدگی محاسباتی قابل اجرا نیستند؛ بنابرین نیاز به الگوریتم های کار آمد است. در این تحقیق، با به کارگیری رویکرد غربال گری مستقل مطمین ابتدا متغیرهای موثر شناسایی شده سپس با این مجموعه متغیرها، عملکرد چهار روش رده بندی؛ تحلیل ممیزی خطی، تحلیل ممیزی درجه دوم، 1– نزدیک ترین همسایگی و رگرسیون لجستیک برای یک داده واقعی بررسی شده و نتایج باهم مقایسه شده اند.
Keywords:
Authors
سعید محمدی
گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود
داود شاهسونی
گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود
حسین باغیشنی
گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود