آموزش های مقیاس بزرگ از جریان داده ها با آپاچی ساموا

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 500

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CEITCONF02_004

تاریخ نمایه سازی: 27 اردیبهشت 1398

Abstract:

در این مقاله نشان می دهیم که چقدر ساده است که یک کار یادگیری ماشین مقیاس بزرگ را در samoa اجرا کنیم ما یکروش جمعی را با استفاده از درخت تصمیم گیری در مجموعه داده جنگل ارزیابی خواهیم کرد.آپاچی samoa یک پلت فرم برای جریان دادههای بزرگ داده کاوی است .این الگوریتم مجموعه ای از الگوریتم های پخش توزیع شده را برای رایج ترین داده کاوی و وظایف یادگیری ماشین مانند طبقه بندی ,خوشه بندی ,و رگرسیون و ....همچنین برنامه ریزی انتزاعی برای توسعه الگوریتم های جدید که در بالای موتورهای پردازش جریان توزیع شده (DSPEs ) اجرا میشوند را فراهم می کند .این مدل دارای یک معماری pluggable است که به آن اجازه میدهد تا در چندین DSPEs مثل طوفان آپاچی ,آپاچی، S4 آپاچی Samza و Apache Flink اجرا شود. Samoa شبیه به Mahout در اسپریت است اما طراحی مخصوص برای جریان داده کاوی می باشد. استفاده از نرم افزار آپاچی ساده و سرگرم کننده است !هدف از این مستندسازی ,ارایه مقدمه ای بر چگونگی استفاده از Samoa به روشهای مختلف است .به عنوان یک کاربر میتوانید الگوریتم های Samoa را در چندین موتور پردازش جریان اجرا کنید: مد محلی ,طوفان S4, Samza و Flink به عنوان یک توسعه دهنده میتوانید فقط یکبار الگوریتم های جدید ایجاد کنید و آنها را در تمام این موتورهای پردازش جریان توزیع شده آزمایش کنید.آپاچی ساموا به زبان جاوا نوشته شده و در سایت زیر در دسترس است.اجرا شود

Keywords:

Authors

فرهنگ پدیداران مقدم

استادیار،گروه کامپیوتر، مجتمع آموزش عالی فنی مهندسی، اسفراین

زکیه صادق زاده

دانشجوی کارشناسی ارشد مهندسی نرم افزار، موسسه ی آموزش عالی اشراق بجنورد