تقسیم امتیاز بین عامل های همکار در یادگیری وظایف عطفی موازی

Publish Year: 1381
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,398

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI08_003

تاریخ نمایه سازی: 18 بهمن 1386

Abstract:

به طور سنتی در غالب پژوهش های مربوط به یادگیری تقویتی چند عامله، تعیین بازخوردی فردی عالم ها بر عهده محیط گذارده میشود . درحالیکه در بسیاری از موارد عملی، نقاط محیط هوشمندی لازم برای انجام این کار را ندارد. به عبارت دیگر محیط قادر به تعیین نقش هر عامل در نتیجه گروهی کسب شده نیست. درحالت کلی در چنین مواردی صرفا یک بازخورد گروهی از طرف محیط مهیا می شود که باید به نحوی بین عامل ها تقسیم شود . در این تحقیق مساله مذکور هنگامی که عامل ها به صورت موازی و همزمان وظایف خود را انجام می دهند و موفقیت تیمی صرفا با تصمیم گیری درست تک تک آنهاحاصل میشود مد نظر است. مقاله حاضر ایده استفاده از سوابق یادگیری عامل ها به منظور ارزیابی دانش هر یک و نهایتا قضاوت درمورد نقش انها در نتیجه گروهی رامطرح می کند. سه معیار به نام های خبرگی، خبرگی نسبی و اطمینان معرفی شده اندو دو الگوریتم برای انتساب امتیازات فردی ارائه شدهاست. توانایی ها و چگونگی عملکرد هر یک از معیارها در تخمین درست نقش عامل ها در غالب یک محیط قطعی مناسب مورد بررسی و مقایسهقرار گرفته است، در شرایطی که عامل ها با روش Q-learning به یادگیری وظیفه تک مرحله ای خود میپردازند. در نهایت نتایج حاصل از شبیه سازی ها نیز برای نشان دادن کارایی روش های پیشنهادی در عمل ذکرشده اند.

Keywords:

یادگیری تقویتی چند عامله , تقسیم امتیار بین عاملها , انتساب پاداش و تنبیه , نقاد محلی , وظیفه موازی عطفی , همکاری

Authors

احد هراتی

قطب علمی کنترل و پردازش هوشمند - ازمایش

مجید نیلی احمدآبادی

قطب علمی کنترل و پردازش هوشمند - ازمایش

بابک نجاراعرابی

قطب علمی کنترل و پردازش هوشمند - ازمایش

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • R. S. Sutton, and A. G. Barto, Re inforcement Learning: ...
  • R. S. Sutton (editor), ،+Machine Learning: Special Issue on Re ...
  • L. P. Kaelbling, M. L. Littman, and A. W. Moore, ...
  • S. Sen, and G. Weiss, *Learning in Multiagent Systems", In ...
  • R. S. Sutton, Temporal Credit Assignment in Re inforcement Learning, ...
  • C. Watkins, J. Christopher, and P. Dayan, _ Q-Learning', Technical ...
  • M. Tan, ،+Multi Agent Re inforcement Learning Independent vs. Cooperative ...
  • S. Arai, K. Sycara, and T. R. Payne, *Multi-agent Re ...
  • S. Arai, K. Miyazaki, and S. Kobayashi, :Multi-agent Re inforcement ...
  • K. Miyazaki, and S. Kobayashi, *Rationality of Reward Sharing in ...
  • J. J. Grefenstette, Credit Assignment in Role Discovery Systems Based ...
  • S. Arai, K. Sycara, and T. R. Payne, *Experience Based ...
  • M.A. Abbasi, Evaluation of Effects of Re inforcement Distribution _ ...
  • M. _ Abbasi, M. Nili Ahmadabadi, and M. Asadpour, 6An ...
  • A. Harati, and M. Nili Ahmadabadi, ،A New Approach to ...
  • A. Harati, and M. Nili Ahmadabadi, *Multiagent Credit Assignment in ...
  • A. Harati, and M. Nili Ahmadabadi, *Certainty and Expertness-B ased ...
  • M. Nili Ahmadabadi, and M. Asadpour, *Expertness Based Cooperative Q-Learning ...
  • نمایش کامل مراجع