تعیین آرایش بهینه یگان ها با استفاده از یادگیری تقویتی چند عاملی در بازی جنگ

علی اکرمی زاده; احمد افشار; محمد باقر منهاج; سمیرا جعفری

تعیین آرایش بهینه یگان ها با استفاده از یادگیری تقویتی چند عاملی در بازی جنگ

Publish place: Electronics Industries Quarterly، Vol: 1، Issue: 1

Publish Year: 1389

Type: Journal paper

Language: Persian

This Paper With 26 Page And PDF Format Ready To Download

DOWNLOAD Paper

Certificate
I'm the author of the paper

Export:

Link to this Paper:

https://civilica.com/doc/1221340

Document National Code:

JR_SAIRAN-1-1_006

Index date: 29 May 2021

تعیین آرایش بهینه یگان ها با استفاده از یادگیری تقویتی چند عاملی در بازی جنگ abstract

در این مقاله، به مسئله یادگیری تقویتی چندعاملی با کاربرد در باز یجنگ پرداخته شده است. ساختارهای نظامی باعث ایجاد اولویت در اجرای تصمیمات بین عامل های درگیر در صحنه نبرد می شود. حالت های استاتیک تصمیم گیری بین عامل ها در این ساختارهای را می توان در قالب بازی های بسیط بیان کرد. فرآیند مزبور در چارچوب بازیهای مارکوف بسیط مدل شده که عمل مشترک بهینه از طریق محاسبه نقطه تعادل نش کامل زیربازی به دست می آید. با استفاده از مفهوم ارزشهای انجمنی، امکان ایجاد مصالحه در انتخاب عمل بهینه نقطه تعادل نش و اکتشاف عمل های جدید فراهم شده است. شبیه سازی انجام شده بر روی نسخه ساد های از یک باز یجنگ واقعی، علاوه بر تا یید همگرایی، کارآمدی این روش را در بررسی پدیده های مختلف جنگ نشان میدهد

تعیین آرایش بهینه یگان ها با استفاده از یادگیری تقویتی چند عاملی در بازی جنگ Keywords:

بازی جنگ , یادگیری تقویتی چندعاملی , مصالحه بین اکتشاف و استخراج , بازی های مارکوف بسیط , آرایش بندی

تعیین آرایش بهینه یگان ها با استفاده از یادگیری تقویتی چند عاملی در بازی جنگ authors

علی اکرمی زاده

دانشگاه صنعتی امیرکبیر

احمد افشار

دانشگاه صنعتی امیرکبیر.

محمد باقر منهاج

دانشگاه صنعتی امیرکبیر.

سمیرا جعفری

دانشگاه صنعتی امیرکبیر