یک روش جدید استخراج کلاسهای رگرسیونی در مجموعه داده های بزرگ

Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,103

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IDMC01_031

تاریخ نمایه سازی: 20 خرداد 1386

Abstract:

استخراج الگوها و مدلهای مطلوب از پایگاه داده های عظیم توجه بسیاری را در رشته های مختلف بخود جلب کرده است، در این خصوص DM (Knowledge Discovery in Database) KDD و (Data Mining) DM دو زمینه جالب برای محققین در شناسایی الگوها، آمار ، هوش مصنوعی ، یادگیری ماشینی و خصوصا محاسبات در سطوح بالا می باشد. در این مقاله یک روش کارا و استوار (Effect and Robust) به نام (Regression – Class Mixture Decomposition) RCMD برای استخراج کلاسهای رگرسیونی در مجموعه داده های بزرگ (contaminated by noise) ارائه می گردد. اولین گام در پروسه استخراج بیان مفهوم جدید کلاس رگرسیونی می باشد که به عنوان یک زیر مجموعه از مجموعه داده هایی تعریف می شود که موضوع اصلی در مدل رگرسیونی است، گام بعد اختصاص یک مجموعه از داده های درونی به هر کدام از این کلاسهای رگرسیونی و در نهایت تعیین مدلهای رگرسیونی معنی دار در مجوعه داده هاست. این روش با طی کردن این سه مرحله ثابت می کند که در مقابل سهم بزرگی از داده های آمیخته با noise نیز مقاوم است. مجموعه داده های بزرگ به عنوان یک جامعه آمیخته مورد بحث قرار می گیرد که درآن تعداد زیاد و متناهی کلاس رگرسیونی و دیگر ساختارهایی که مدل رگرسیونی به حساب نمی ایند وجود دارد. در انتها ملاک کارایی و استواری روش RCMD یک سلسله از آزمایشهای شبیه سازی شده واقعی می باشد که نشان میدهد روش فوق برای برازاندن کلاسهای رگرسیونی خطی و ساختارهای دیگر غیر خطی به داده های آمیخته در شرایط مختلف مورد استفاده قرار می گیرد.

Authors

طاهره نصراله زاده

دانشجوی کارشناسی ارشد دانشگاه صنعتی امیرکبیر

صادق رضایی

عضو هیات علمی دانشگاه صنعتی امیرکبیر