استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی

فاطمه سارانی راد; علی اکرمی زاده

استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی

Publish place: 12th Iranian Conference on Intelligent Systems

Publish Year: 1392

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/276238

شناسه ملی سند علمی:

ICS12_158

تاریخ نمایه سازی: 11 مرداد 1393

Abstract:

استفاده ازتجربه های عاملهای دیگردریک محیط چندعامله باعث میشود که یک عامل کمتردچاراشتباه و خطا شود و ازتجربه های عاملهای دیگردربدست اوردن حداکثر کارایی استفاده کند برای استفاده ازدانش صحیح عاملهای دیگردرطی فرایندیادگیری ازیکسری معیارهای سنجش خبرگی عاملها استفاده میشود همچنین برای تسریع فرایندیادگیری دریادگیری تقویتی ازتکنیک شکل دهی پاداش استفاده میشود دراین مقاله یک روش ترکیبی جدید مبتنی برشکل دهی پاداش و اشتراک وزن داراستراتژی درطی فرایند یادگیری دریک محیط چندعامله پیشنهادداده شده است روش پیشنهادی موجب تسریع فرایندیادگیری و دستیابی به حداکثر پاداش شده است نتایج تجربی کارایی روش پیشنهادی درفرایند یادگیری روی محیط شبیه سازی را نشان میدهد

Keywords:

یادگیری تقویتی , شکل دهی پاداش , سیستم چندعامله , یادگیری Q

Authors

فاطمه سارانی راد

دانشجوی کارشناسی ارشدعلوم تصمیم ومهندسی دانش دانشگاه علوم اقتصادی تهران

علی اکرمی زاده

استادیارگروه مهندسی برق و کامپیوتردانشگاه صنعتی خواجه نصیرالدین طوسی تهران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Kaelbling, L.P., Littman, M.L., Moore, A.W., "Reinforcement Learning: A Survey", ...
Sutton, R.S., Barto, A.G., "Reinforcement learning: An introduction", Cambridge, MA: ...
Wiewiora, Eric., _ 'Potential-based shaping and Q- _ lueinitialization are ...
Devlin, Sam., Kudenko, Daniel, "Dynamic Potential- Based Reward Shaping", 11th ...
Watkins, CJCH., "Learning with delayed rewards , PhD Psychology ...
Department, England, 1989. ...
Whitehead, S., Ballard, D., "A study of cooperative mechanisms for ...
Tan, M., "Multi-agent reinforcement learning: independent vs. cooperative agents ", ...
Nili Ahmadabadi, M., Asadpour, M., Khodaabakhsh, Seyyed H., Nakano, E., ...
cooperative learning", international conference on intelligent robots and systems, 2261-2267, ...
Ritthipravat, P., Maneewarn, T., Wyatt, J., Laowattana, D., "Comparison and ...
Yang, M., Tian, Y., Liu, X., "Cooperative Q-learning based on ...
Nili Ahmadabadi, M., Asadpour, M., "Expertness based cooperative Q-learning", IEEE ...
Norouzzadeh, Sholeh., Bu., soniu, Lucian., Babu'ska, Robert., "Efficient Knowledge Transfer ...
Norouzzadeh, Sholeh., "Shaping Methods to Accelerate Reinforcement Learning: From Easy ...
Nili Ahmadabadi, M., Asadpour, M., "Cooperative Qlearning a Knowledge Sharing ...

نمایش کامل مراجع