استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 637

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICS12_158

تاریخ نمایه سازی: 11 مرداد 1393

Abstract:

استفاده ازتجربه های عاملهای دیگردریک محیط چندعامله باعث میشود که یک عامل کمتردچاراشتباه و خطا شود و ازتجربه های عاملهای دیگردربدست اوردن حداکثر کارایی استفاده کند برای استفاده ازدانش صحیح عاملهای دیگردرطی فرایندیادگیری ازیکسری معیارهای سنجش خبرگی عاملها استفاده میشود همچنین برای تسریع فرایندیادگیری دریادگیری تقویتی ازتکنیک شکل دهی پاداش استفاده میشود دراین مقاله یک روش ترکیبی جدید مبتنی برشکل دهی پاداش و اشتراک وزن داراستراتژی درطی فرایند یادگیری دریک محیط چندعامله پیشنهادداده شده است روش پیشنهادی موجب تسریع فرایندیادگیری و دستیابی به حداکثر پاداش شده است نتایج تجربی کارایی روش پیشنهادی درفرایند یادگیری روی محیط شبیه سازی را نشان میدهد

Authors

فاطمه سارانی راد

دانشجوی کارشناسی ارشدعلوم تصمیم ومهندسی دانش دانشگاه علوم اقتصادی تهران

علی اکرمی زاده

استادیارگروه مهندسی برق و کامپیوتردانشگاه صنعتی خواجه نصیرالدین طوسی تهران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Kaelbling, L.P., Littman, M.L., Moore, A.W., "Reinforcement Learning: A Survey", ...
  • Sutton, R.S., Barto, A.G., "Reinforcement learning: An introduction", Cambridge, MA: ...
  • Wiewiora, Eric., _ 'Potential-based shaping and Q- _ lueinitialization are ...
  • Devlin, Sam., Kudenko, Daniel, "Dynamic Potential- Based Reward Shaping", 11th ...
  • Watkins, CJCH., "Learning with delayed rewards , PhD Psychology ...
  • Department, England, 1989. ...
  • Whitehead, S., Ballard, D., "A study of cooperative mechanisms for ...
  • Tan, M., "Multi-agent reinforcement learning: independent vs. cooperative agents ", ...
  • Nili Ahmadabadi, M., Asadpour, M., Khodaabakhsh, Seyyed H., Nakano, E., ...
  • cooperative learning", international conference on intelligent robots and systems, 2261-2267, ...
  • Ritthipravat, P., Maneewarn, T., Wyatt, J., Laowattana, D., "Comparison and ...
  • Yang, M., Tian, Y., Liu, X., "Cooperative Q-learning based on ...
  • Nili Ahmadabadi, M., Asadpour, M., "Expertness based cooperative Q-learning", IEEE ...
  • Norouzzadeh, Sholeh., Bu., soniu, Lucian., Babu'ska, Robert., "Efficient Knowledge Transfer ...
  • Norouzzadeh, Sholeh., "Shaping Methods to Accelerate Reinforcement Learning: From Easy ...
  • Nili Ahmadabadi, M., Asadpour, M., "Cooperative Qlearning a Knowledge Sharing ...
  • نمایش کامل مراجع