CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک معماری توزیع شده موازی برای ذخیره و پردازش مجموعه داده های بزرگ

عنوان مقاله: ارائه یک معماری توزیع شده موازی برای ذخیره و پردازش مجموعه داده های بزرگ
شناسه ملی مقاله: ITCC01_193
منتشر شده در کنفرانس بین المللی پژوهش های کاربردی در فناوری اطلاعات، کامپیوتر ومخابرات در سال 1394
مشخصات نویسندگان مقاله:

سعید گلزار - دانشگاه آزاد اسلامی واحد اراک،گروه کامپیوتر، اراک، ایران

خلاصه مقاله:
در دوره ای زندگی می کنیم که تکنولوژی های انباره داده، سخت افزار و نرم افزار به سمت نقطه ای تغییر مسیر دادهاست که ذخیره انبوهی از داده ساخت یافته و غیرساخت یافته خیلی ارزان تر شده است. محبوبیت فزاینده رسانه هایجمعی موجب انباشتگی مقدار حجیمی از داده، غالبا غیرساخت یافته شده که آنالیز این داده می تواند منجر به استخراجبینش های با ارزش شود. استخراج اطلاعات معنی دار، کاربردی و صحیح در یک زمان مناسب از مجموعه داده هایبسیار بزرگ یک عملیات پیچیده ای است که نیاز به انتخابی دقیق در نرم افزار و سخت افزار زیرساخت و مدل دادهصحیح دارد. لایه های معماری ذخیره و پردازش داده و در نهایت استخراج اطلاعات کاربردی تابع ساختار ساسله مراتبیایی هست که تفکیک سطوح، انعطاف پذیری و قابلیت همزیستی با ساختار کنونی سازمان در آن از اهمیت زیادیبرخوردار است. این مقاله مسئله ذخیره، پردازش و واکشی بینش هدف دار از پتابایت ها داده را بررسی می کند. در اینراستا یک بررسی درباره تکنولوژی های موازی و توزیع شده داده کنونی خواهد شد و مبتنی بر آنها یک معماری بهینه وکاربردی پیشنهاد می گردد.

کلمات کلیدی:
مجموعه داده بزرگ، توزیع شده، انباره داده، ابر ، هدوپ

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/450981/