ترکیب عملیات checkpoint هماهنگ و غیر هماهنگ در قرارداد ثبت بدبینانه وقایع مبتنی بر فرستنده

Publish Year: 1385
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,372

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI12_196

تاریخ نمایه سازی: 23 دی 1386

Abstract:

اجرای برنام ه های موازی MPI بر روی سیستمهای کلاستر و گری د معمولاً در معرض خطر خرابی سیستم و یا شبکه م یباش د. لذا استفاده از پیاد هسازیهای تحمل پذیر در برابر خرابی در این گونه سیستمها امری اجتناب ناپذیر اس ت. دو دسته از روشها برای تحم لپذیر ساختن این گونه سیستمها به کار می رود که یکی مبتنی برcheckpoint گرفتن از حالت پروسه های در حال اجرا و دیگری مبتنی بر ثبت وقایع می باشد.عیب روش ثبت بدبینان ه وقای ع مبتنی بر فرستنده که در دسته دوم قرار م یگیرد حجم زیاد پیامهایی است که باید در حافظه فرار نگ هداری شوند. در این مقاله ما برای رفع مشکل ذکر شده روشcheckpoint هماهنگ از محتوی پیامها (CCMP)را ارائه کرد هایم. نتایج آزمایشات دلالت بر کاهش زمان اجر ا در روش پیشنهاد ی برای برنام ه های سنجش NPB در محیطهای بدون خرابی و دارای خرابی دارد.

Keywords:

کلاستر , بازیافت , تحمل خرابی , قرارداد ثبت بدبینانه وقایع

Authors

مهدی امینیان

دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنع

محمدکاظم اکبری

استادیار دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ام

بهمن جوادی

دانشجوی دکتری دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنع

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • دانشگاه شهید بهشتی، دانشکده مهندسی برق و کامپیوتر، تهران، ایران، ...
  • W. Gropp and E. Lusk, ?Fault tolerance in MPI programs, ...
  • D. B. Johnson and W. Zwaenepoel, *Sender-based message logging, 17" ...
  • D. H. Bailey, T. Harris, et al, 0The NAS parallel ...
  • E. Strom and S. Yemini, 'Optimistic recovery in distributed systems, ...
  • E. N. Elnozahy and W. Zwaenepoel, _ On the use ...
  • D.B. Johnson, *Distributed System Fault Tolerance Using Message Logging and ...
  • A. Bouteiller, T. Herault, et al, ?MPICH-V: a Multiprotocol Fault ...
  • A. P. Sistla and J. L. Welch, *Efficient distributed recovery ...
  • M. Elnozahy, L. Alvisi, Y. M. Wang and D. B. ...
  • A. Bouteiller, F. Cappello, et al, ?MPICH-V2: a fault tolerant ...
  • Message Payload Checkpoint ...
  • Checkpoint Server ! open-Source ...
  • Fast Ethernet " Dispatcher ...
  • Checkpoint Scheduler * Event Logger ...
  • نمایش کامل مراجع