آموزش های مقیاس بزرگ از جریان داده ها با آپاچی ساموا
Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 551
This Paper With 9 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CEITCONF02_004
تاریخ نمایه سازی: 27 اردیبهشت 1398
Abstract:
در این مقاله نشان می دهیم که چقدر ساده است که یک کار یادگیری ماشین مقیاس بزرگ را در samoa اجرا کنیم ما یکروش جمعی را با استفاده از درخت تصمیم گیری در مجموعه داده جنگل ارزیابی خواهیم کرد.آپاچی samoa یک پلت فرم برای جریان دادههای بزرگ داده کاوی است .این الگوریتم مجموعه ای از الگوریتم های پخش توزیع شده را برای رایج ترین داده کاوی و وظایف یادگیری ماشین مانند طبقه بندی ,خوشه بندی ,و رگرسیون و ....همچنین برنامه ریزی انتزاعی برای توسعه الگوریتم های جدید که در بالای موتورهای پردازش جریان توزیع شده (DSPEs ) اجرا میشوند را فراهم می کند .این مدل دارای یک معماری pluggable است که به آن اجازه میدهد تا در چندین DSPEs مثل طوفان آپاچی ,آپاچی، S4 آپاچی Samza و Apache Flink اجرا شود. Samoa شبیه به Mahout در اسپریت است اما طراحی مخصوص برای جریان داده کاوی می باشد. استفاده از نرم افزار آپاچی ساده و سرگرم کننده است !هدف از این مستندسازی ,ارایه مقدمه ای بر چگونگی استفاده از Samoa به روشهای مختلف است .به عنوان یک کاربر میتوانید الگوریتم های Samoa را در چندین موتور پردازش جریان اجرا کنید: مد محلی ,طوفان S4, Samza و Flink به عنوان یک توسعه دهنده میتوانید فقط یکبار الگوریتم های جدید ایجاد کنید و آنها را در تمام این موتورهای پردازش جریان توزیع شده آزمایش کنید.آپاچی ساموا به زبان جاوا نوشته شده و در سایت زیر در دسترس است.اجرا شود
Authors
فرهنگ پدیداران مقدم
استادیار،گروه کامپیوتر، مجتمع آموزش عالی فنی مهندسی، اسفراین
زکیه صادق زاده
دانشجوی کارشناسی ارشد مهندسی نرم افزار، موسسه ی آموزش عالی اشراق بجنورد