مروری بر مفاهیم و انواع روشهای داده کاوی در کلان داده

مهدی یوسف زاده اقدم; مریم فرشچیان یزدی; الهه کاشانی; سیدرضا کامل طباخ

مروری بر مفاهیم و انواع روشهای داده کاوی در کلان داده

Publish place: Fourth International Conference on Modern Studies in Computer Science and Information Technology

Publish Year: 1396

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 19 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/779042

شناسه ملی سند علمی:

CONFITC04_019

تاریخ نمایه سازی: 6 مهر 1397

Abstract:

با گسترش علوم در دنیای امروزی، حجم انبوهی از داده ها به وجود آمده است و در هر لحظه تعداد زیادی داده تولیدمیشود. جهت استخراج و کشف دانش از این داده ها، باید بتوان آنها را ذخیره و پردازش کرد. داده کاوی یکی ازروشهایی است که اطلاعات مفید و روابط مخفی بین داده ها را استخراج می کند ولی به علت حجم بالا و ساختارهایمتنوع داده های حجیم امروزی، نمی توان از این روشها جهت استخراج دانش استفاده کرد. همچنین ذخیره سازی و پردازشچنین حجمی از دادهها با روشهای معمول و قدیمی از نظر زمان و هزینه مقرون به صرفه نیست. بنابراین یا باید ساختارالگوریتم های داده کاوی تغییر کند و یا با روشهای جدیدی جایگزین شوند. داده های حجیم به دو صورت دسته ای وجریان های در حال حرکت وجود دارند که باید بتوان با استفاده از موازی سازی سخت افزاری و نرم افزاری و پردازش هایجریانی، اطلاعات مفید را از آنها استخراج کرد. در حال حاضر مهمترین مدل برای پردازش داده های حجیم، مدل نگاشت-کاهش است که توسط شرکتهای زیادی برای پردازش داده هایشان استفاده می شود. نسخه متنباز نگاشت-کاهش توسطهدوپ ارایه شد. در این مقاله ابتدا سیر تکاملی انواع پردازش ها روی داده های حجیم مورد بررسی قرار گرفته و سپسروشهای تجزیه و تحلیل این داده ها معرفی شده است و در نهایت الگوریتم k-means که یکی از مهمترین روشهایخوشه بندی است در محیط هدوپ پیاده سازی شده است.

Keywords:

داده های حجیم , داده کاوی , خوشه بندی , الگوریتم K-means , بستر هدوپ

Authors

مهدی یوسف زاده اقدم

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه آزاد اسلامی ، مشهد ، ایران

مریم فرشچیان یزدی

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه آزاد اسلامی ، مشهد ، ایران

الهه کاشانی

کارشناسی ارشد فناوری اطلاعات،مدرس مرکز آموزش علمی کاربردی مالیاتی مشهد، ایران

سیدرضا کامل طباخ

استادیار گروه کامپیوتر، دانشکده مهندسی، دانشگاه آزاد اسلامی ،مشهد ، ایران