روشی جدید برای افزایش سرعت یادگیری تقویتی توزیع شده ، IBSAQL

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 870

This Paper With 8 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICS11_101

تاریخ نمایه سازی: 14 مهر 1392

Abstract:

در این مقاله، الگوریتم جدیدی مبتنی بر یادگیر تقویتی توزیع شده، برای افزایش سرعت یادگیری، در الگوریتم های یادگیری تقویتی ارائه شده است. در روش پیشنهادی، به ازای هر حالت از محیط، به تعداد اعمال مجاز آن حالت، عامل مجازی در نظر گرفته شده است و همچنین یک تابع بهبود یافته ی جدید برای انتخاب عمل در هر حالت پیشنهاد شده است، که موجب تسریع در الگوریتم های مبتنی بر Q-learning می شود. از الگوریتم مذکور برای حل بازی های مارکوف استفاده شده است. برتری تابع پیشنهادی با انجام آزمایشات متعدد نشان داده است. نتایج به دست آمده در آزمایش ها نشان می دهد، که الگوریتم پیشنهادی از لحاظ رعت رسیدن به پاسخ بهینه و میانگین پاداش های به دست آمده، دارای کارایی بسیار بالایی به روش های قبلی است

Authors

سارا اسفندیاری

دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین

سمیرا داور قلاتی

دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین

مهدیه اسفندیاری

دانشگاه آزاد اسلامی واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات دانشگاه آزاد اسلامی قزوین

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • یازدهمین کنفرانس سیستم‌های هوشمند ایران 9 و 10 اسفند 1391 ...
  • Kaufmann , San Francisco , CA , pp.5 35-542, 2000. ...
  • G. Weiss; Multi-agent Systems: "A Modern Approach to Distributed Artificial ...
  • _ 800 1000 1200 1400 1600 1800 2000 2206 2400 ...
  • L. Busoniue , R. Babuska and B. D. Schutter , ...
  • Y. Shoham; "Multi-agent Systems: Algorithmic Game Theoretic and Logical Foundations", ...
  • , Volume 1, Morgan Kaufmann Publishers Inc. , Stockholm, Sweden, ...
  • J. Hu and M. P. Wellman, "Nash Q-Learning for General-Sum ...
  • M. Littman, Markov Games as a Framework for Multi- agent ...
  • K. Tuyls, A. Nowe, T. Lenaerts, and B. Manderick . ...
  • L. Matignon, G. Laurent, N. Le Fort-Pit , "Coordination of ...
  • International Conference _ Machine Learning , San Fransisco , Morgan ...
  • M. Lauer and M Riedmiller, "Reinforcement Learning for Stochastic cooperative ...
  • Decentralized Reinforcement Learning in Cooperative Multi-agent Teams _ ' , ...
  • نمایش کامل مراجع