اتوماتاهای یادگیر، راه حلی برای بازی های غیر قطعی بامجموع کلی
Publish place: 2nd Joint Congress on Fuzzy and Intelligent Systems
Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 835
This Paper With 9 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
FJCFIS02_302
تاریخ نمایه سازی: 26 تیر 1392
Abstract:
بازی های غیر قطعی(اتفاقی) برای مدل سازی سیستمهای چند عامله بسیار مورد استفاده قرار گرفته اند.این بازیها توسعه ای از فرآیندهای تصادفی مارکوف با چندین عامل و بازی های ماتریسی با چندین حالت هستند.هدف هرعامل پیدا کردن سیاستبهینه ای است بطوریکه امید ریاضی مجموع کاهشیافته پاداشها را بیشینه نماید. در این مقاله یک مدل یادگیری تقویتی مبتنی بر اتوماتاهای یادگیر برای حل بازی های اتفاقی با مجموع کلی برای یافتن خطمشی بهینه پیشنهاد شده است.بازای هر حالت در محیط یک اتوماتا قرار داده شده بطوریکه تعداد اعمال هر اتوماتا با توجه به همسایگانش تعیین میگردد.هر اتوماتا مسوول انتخاب حالتبعدی محیط است. آزمایشهای انجام گرفته نشان دادهاند که الگوریتم ارائه شده از کارایی مناسبی از هر دو جنبه هزینه و سرعت رسیدن به راهحل بهینه برخوردار است
Keywords:
Authors
بهروز معصومی
دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران و مرکز تحقیقات
محمدرضا میبدی
دانشگاه صنعتی امیرکبیر تهران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :