بررسی تحلیلی روش های مختلف خوشه بندی داده به صورت توزیع شده
Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,149
This Paper With 17 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CSITM01_512
تاریخ نمایه سازی: 10 شهریور 1393
Abstract:
افزایش روزافزون حجم اطلاعات و همچنین محدودیت فضای ذخیره سازی آن، چالشی انکارناپذیر در امر پردازش اطلاعات است که این امر بهره گیری از پردازش توزیع شده در سیستم های مختلف را ایجاب می کند. بسیاری از مسائل در دنیای آمار و یادگیری ماشین با توجه به پیچیدگی و افزایش حجم مجموعه داده ها به علت تعداد بسیار زیاد نمونه ها با ویژگی ها، قابل حل توسط الگوریتم های کلاسیک یادگیری ماشین نیستند. یادگیری ماشین به صورت توزیع شده به بررسی الگوریتم های یادگیری ماشین با سه رویکرد کلی موازی سازی داده، موازی سازی الگوریتم و موازی سازی ترکیبی می پردازد. در روش های خوشه بندی توزیع شده مجموعه داده ی حجیم، با تقسیم به مجموعه داده های کوچکتر در سیستم های مختلف توزیع می شوند. تقسیم مجموعه داده به دو صورت کلی انجام می شود؛ مجموعه داده هایی که تعداد نمونه های زیادی دارند، در طول نمونه ها تقسیم می شوند و در م سائلی مانند بیوانفورماتیک، مجموعه داده هایی که تعداد ویژگی های زیادی دارند می توانند در طول ویژگی ها تقسیم شوند. در این مقاله سعی شده است، با معرفی روش های مختلف خوشه بندی توزیع شده جالش های این حوزه مورد بحث قرار گیرد. لازم به ذکر است که آنچه در پیاده سازی این روش ها مورد توجه قرار گرفته است، استفاده از MPI برای انتقال اطلاعات بین سیستم ها است.
Keywords:
Authors
طاهره اسمعیلی ابهریان
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد قزوین
محمدباقر منهاج
عضو هیئت علمی دانشگاه صنعتی امیرکبیر (پلی تکنیک تهران)
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :