CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

آموزش های مقیاس بزرگ از جریان داده ها با آپاچی ساموا

عنوان مقاله: آموزش های مقیاس بزرگ از جریان داده ها با آپاچی ساموا
شناسه ملی مقاله: CEITCONF02_004
منتشر شده در دومین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی در سال 1397
مشخصات نویسندگان مقاله:

فرهنگ پدیداران مقدم - استادیار،گروه کامپیوتر، مجتمع آموزش عالی فنی مهندسی، اسفراین
زکیه صادق زاده - دانشجوی کارشناسی ارشد مهندسی نرم افزار، موسسه ی آموزش عالی اشراق بجنورد

خلاصه مقاله:
در این مقاله نشان می دهیم که چقدر ساده است که یک کار یادگیری ماشین مقیاس بزرگ را در samoa اجرا کنیم ما یکروش جمعی را با استفاده از درخت تصمیم گیری در مجموعه داده جنگل ارزیابی خواهیم کرد.آپاچی samoa یک پلت فرم برای جریان دادههای بزرگ داده کاوی است .این الگوریتم مجموعه ای از الگوریتم های پخش توزیع شده را برای رایج ترین داده کاوی و وظایف یادگیری ماشین مانند طبقه بندی ,خوشه بندی ,و رگرسیون و ....همچنین برنامه ریزی انتزاعی برای توسعه الگوریتم های جدید که در بالای موتورهای پردازش جریان توزیع شده (DSPEs ) اجرا میشوند را فراهم می کند .این مدل دارای یک معماری pluggable است که به آن اجازه میدهد تا در چندین DSPEs مثل طوفان آپاچی ,آپاچی، S4 آپاچی Samza و Apache Flink اجرا شود. Samoa شبیه به Mahout در اسپریت است اما طراحی مخصوص برای جریان داده کاوی می باشد. استفاده از نرم افزار آپاچی ساده و سرگرم کننده است !هدف از این مستندسازی ,ارایه مقدمه ای بر چگونگی استفاده از Samoa به روشهای مختلف است .به عنوان یک کاربر میتوانید الگوریتم های Samoa را در چندین موتور پردازش جریان اجرا کنید: مد محلی ,طوفان S4, Samza و Flink به عنوان یک توسعه دهنده میتوانید فقط یکبار الگوریتم های جدید ایجاد کنید و آنها را در تمام این موتورهای پردازش جریان توزیع شده آزمایش کنید.آپاچی ساموا به زبان جاوا نوشته شده و در سایت زیر در دسترس است.اجرا شود

کلمات کلیدی:
؛Big Data، آپاچی، Samoa

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/849041/