انتخاب متغیر در داده های بزرگ

سعید محمدی; داود شاهسونی; حسین باغیشنی

انتخاب متغیر در داده های بزرگ

Publish place: 1st National Conference on Soft Computing

Publish Year: 1394

Type: Conference paper

Language: Persian

This Paper With 6 Page And PDF Format Ready To Download

DOWNLOAD Paper

Certificate
I'm the author of the paper

Export:

Link to this Paper:

https://civilica.com/doc/656636

Document National Code:

CSCG01_126

Index date: 21 October 2017

انتخاب متغیر در داده های بزرگ abstract

فناوری های نوین، داده های حجیمی را در بعد بالا تولید می کنند که مسیله تحلیل آنها موجب ابداع روش های جدید آماری و یادگیری ماشین شده است. قبل از اعمال بسیاری از این روش ها، معمول است که بعد داده های اصلی توسط روش هایی نظیر تحلیل مولفه های اصلی، رده بندی های درخت تصمیم، لاسو و غیره کاهش داده شده و متغیرهای موثر شناسایی شوند؛ اما در مواجهه با داده های بزرگ در بعد بالا، بسیاری از این روش ها به دلیل حجم و پیچیدگی محاسباتی قابل اجرا نیستند؛ بنابرین نیاز به الگوریتم های کار آمد است. در این تحقیق، با به کارگیری رویکرد غربال گری مستقل مطمین ابتدا متغیرهای موثر شناسایی شده سپس با این مجموعه متغیرها، عملکرد چهار روش رده بندی؛ تحلیل ممیزی خطی، تحلیل ممیزی درجه دوم، 1– نزدیک ترین همسایگی و رگرسیون لجستیک برای یک داده واقعی بررسی شده و نتایج باهم مقایسه شده اند.

انتخاب متغیر در داده های بزرگ Keywords:

غربالگری مستقل مطمین , تحلیل ممیزی خطی , تحلیل ممیزی درجه دوم , 1 , نزدیکترین همسایگی

انتخاب متغیر در داده های بزرگ authors

سعید محمدی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود

داود شاهسونی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود

حسین باغیشنی

گروه آمار، دانشکده علوم ریاضی، دانشگاه شاهرود