یادگیری تقویتی در سیستم های چندعامله غیرهمکار

عاطفه بابایی

یادگیری تقویتی در سیستم های چندعامله غیرهمکار

Publish place: Ninth International Symposium on Science and Technology Advances

Publish Year: 1393

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/841573

شناسه ملی سند علمی:

SASTECH09_149

تاریخ نمایه سازی: 11 اردیبهشت 1398

Abstract:

یکی از مسایلی که در زمینه تحقیقات سیستم های چندعامله مورد توجه قرار گرفته است، استفاده از تکنیکهای یادگیر تجهیز سیستمهای چندعامله با تواناییهای یادگیری میباشد. در این مسایل چندین تعادل نش وجود دارد. در یادگیری تقویتی سیستم های چندعامله، بیشترین تضمین همگرایی الگوریتم های یادگیری به تعادل نش بهینه است. بازی های تصادفی بعنوان توسعهای از فرایندهای تصادفی مارکوف با چندعامل در سیستمهای چندعامله مدلسازی آنها دارای اهمیت بوده بعنوان چارچوبی مناسب در تحقیقات یادگیری تقویتی چندعامله بکار رفته اند. در این مقاله الگوریتم یادگیری تقویتی Nash-Q برای حل نوعی از بازی تصادفی Grid-World که سیستم چندعامله غیرهمکار است دارای دو تعادل نش است، بکار برده شد نتایج نشان داده شدند.

Keywords:

سیستم های چندعامله , تیوری بازی ها , یادگیری تقویتی , Nash Q-learning , بازی های تصادفی

Authors

عاطفه بابایی

دانش آموخته کارشناسی ارشد دانشگاه علوم اقتصادی تهران