مروری بر مفاهیم و انواع روشهای داده کاوی در کلان داده

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,092

This Paper With 19 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CONFITC04_019

تاریخ نمایه سازی: 6 مهر 1397

Abstract:

با گسترش علوم در دنیای امروزی، حجم انبوهی از داده ها به وجود آمده است و در هر لحظه تعداد زیادی داده تولیدمیشود. جهت استخراج و کشف دانش از این داده ها، باید بتوان آنها را ذخیره و پردازش کرد. داده کاوی یکی ازروشهایی است که اطلاعات مفید و روابط مخفی بین داده ها را استخراج می کند ولی به علت حجم بالا و ساختارهایمتنوع داده های حجیم امروزی، نمی توان از این روشها جهت استخراج دانش استفاده کرد. همچنین ذخیره سازی و پردازشچنین حجمی از دادهها با روشهای معمول و قدیمی از نظر زمان و هزینه مقرون به صرفه نیست. بنابراین یا باید ساختارالگوریتم های داده کاوی تغییر کند و یا با روشهای جدیدی جایگزین شوند. داده های حجیم به دو صورت دسته ای وجریان های در حال حرکت وجود دارند که باید بتوان با استفاده از موازی سازی سخت افزاری و نرم افزاری و پردازش هایجریانی، اطلاعات مفید را از آنها استخراج کرد. در حال حاضر مهمترین مدل برای پردازش داده های حجیم، مدل نگاشت-کاهش است که توسط شرکتهای زیادی برای پردازش داده هایشان استفاده می شود. نسخه متنباز نگاشت-کاهش توسطهدوپ ارایه شد. در این مقاله ابتدا سیر تکاملی انواع پردازش ها روی داده های حجیم مورد بررسی قرار گرفته و سپسروشهای تجزیه و تحلیل این داده ها معرفی شده است و در نهایت الگوریتم k-means که یکی از مهمترین روشهایخوشه بندی است در محیط هدوپ پیاده سازی شده است.

Authors

مهدی یوسف زاده اقدم

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه آزاد اسلامی ، مشهد ، ایران

مریم فرشچیان یزدی

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه آزاد اسلامی ، مشهد ، ایران

الهه کاشانی

کارشناسی ارشد فناوری اطلاعات،مدرس مرکز آموزش علمی کاربردی مالیاتی مشهد، ایران

سیدرضا کامل طباخ

استادیار گروه کامپیوتر، دانشکده مهندسی، دانشگاه آزاد اسلامی ،مشهد ، ایران