به کارگیری اتوماتای یادگیر در سیستمهای چند عامله همکار

محمدرضا آیت اله زاده شیرازی; محمدرضا میبدی

به کارگیری اتوماتای یادگیر در سیستمهای چند عامله همکار

Publish place: 01st International Conference on Information and Knowledge Technology

Publish Year: 1382

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 11 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/72105

شناسه ملی سند علمی:

ICIKT01_003

تاریخ نمایه سازی: 24 اردیبهشت 1388

Abstract:

یکی از مشکلاتی که الگوریتمهای یادگیری تقویتی در سیستمهای چند عامله با آن مواجه هستند وجود چندین نقطه موازنه می باشد. در یادگیری تقویتی سیستمهای چند عامله، بیشترین تمرکز بر روی تضمین همگرایی الگوریتمهای یادگیری به نقطه موازنه مطلوب است. این روشها با این مشکل مواجه هستند که عاملها باید انتخاب نقطه موازنه را با یکدیگر هماهنگ کنند. در این مقاله، رفتار اتوماتای یادگیر به عنوان استراتژی تصمیم گیری عاملها در سیستمهای چند عامله به منظور دستیابی به رفتاری هماهنگ مورد بررسی و ارزیابی قرار می گیرد. بدین منظور همگرایی الگوریتم یادگیری اتوماتای یادگیر به عنوان استراتژی تصمیم گیری عاملهایی که در ساختار یک بازی همکاری فعالیت می کنند،در دو حالت وجود یادگیرنده های مستقل و یادگیرنده های مشترک ارزیابی و کارآیی آن با الگوریتم یادگیری Q مقایسه شده است. نتایج حاصل نشان می دهند که استراتژی اتوماتای یادگیر با سرعت خوبی به عمل مشترک بهینه همگرا می شود. دیده می شود که اتوماتای یادگیر در مقایسه با یادگیری Q با سرعت بیشتری احتمالات عمل مشترک بهینه را یاد می گیرد. در رابطه با یادگیرنده های مشترک نیز که بر اعمال یکدیگر نظارت دارند، اتوماتای یادگیر و یادگیری Q در هر دو حالت کارآیی یکسانی از خود نشان می دهند. همچنین، در این مقاله، ایده به کارگیری اتوماتای یادگیر به منظور پیاده سازی استراتژی مذاکره در عاملهای مذاکره کننده ارائه و مورد بررسی قرار می گیرد.

Keywords:

استراتژی مذاکره- اتوماتای یادگیر با ساختار متغیر- سیستم چند عامله- همکاری- یادگیری تقویتی- یادگیری Q

Authors

محمدرضا آیت اله زاده شیرازی

آزمایشگاه محاسبات نرم، دانشکده مهندسی کامپیوتر و فناوری اطلاعات

محمدرضا میبدی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

C. Boutilier, *Planning, learning and coordination in multiagent decision processes?, ...
G. Chalkiadakis and Boutilier C., "Coordination in Multiagent Rein forcement ...
C. Claus, _ Boutilier, _ Dynamics of Learning Reinforc ement ...
L. Kaelbling, L., Littman, A. Moore, ،، R einforcement Learning: ...
D. Fudenberg and D. M. Kreps, _ on Learning and ...
H. Junling and M. Wellman, *Multiagent Reinforc ement Learning in ...
N. R. Jennings, P. Faratin, A. R. Lomuscio, S. Parsons, ...
N. R. Jennings, Sycara, and Wooldridge, A roadmap of agent ...
M. Huhns, and L. Stephens, Multi-agent Systems and Societies of ...
S. L ak shmivarahan _ *Learning Algorithms: Theory and Applications', ...
P. Mars, Chen, J. R. and Nambir, R., "Learning Algorithms: ...
M. R. Meybodi, and S. L ak shmivarahan : *Optimality ...
M. R. Meybodi, and S. Lakshmivarah an : «On a ...
K. Narenrdra, S., M. A. L. Thathachar, *Learning Automata: An ...
S. Sen, G. Weiss , Chapter _ Learning in Multiagent ...
P. Stone, *Layered Learning in Multi-Agent Systems" , PhD thesis, ...
R. Sutton, S., Barto A., G., ،، Re inforcement Learning, ...
M. Tan, *Multi-agent Reinforc ement Learning: Independent VS. Cooperative Agents', ...
M. A. L. Thathachar, Sastry P.S.., "Varieties of Learning Automata: ...

نمایش کامل مراجع