بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی

Publish Year: 1398
نوع سند: مقاله ژورنالی
زبان: Persian
View: 58
  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_TJEE-49-3_014

تاریخ نمایه سازی: 27 تیر 1402

Abstract:

این مقاله به موضوع انتقال یادگیری در محیط­هایی که بعضی از ویژگی­های آن مشترک است می­پردازد. چالش اصلی در این مبحث، نحوه انتقال دانش به­دست­آمده از محیط مبدا به محیط مقصد است. در ایده ارائه­شده با در نظر­گرفتن ویژگی­های مشترک در فضای عامل بین دو محیط، ابتدا مقدار ارزش - عمل در محیط مبدا به­دست می­آید، سپس از یک شبکه عصبی- فازی برای تقریب مقدار تابع ارزش - عمل بهره برده میشود. در محیط مقصد، مقدار ارزش - عمل از ترکیب مقدار پیش­بینی شبکه عصبی - فازی و مقدار به­دست­آمده در خود آن محیط استفاده می­شود. به عبارت دیگر با توجه به آموزش انجام شده در محیط مبدا، مقادیر ارزش - عمل در محیط مقصد از ترکیب مقادیر ارزش - عمل تقریب­زده­شده توسط شبکه عصبی - فازی و مقدار به­دست آمده از الگوریتم یادگیری در آن محیط به­دست می­آید. شایان ذکر است که از الگوریتم یادگیری Q در محیط استفاده شده است. نتایج حاصل از ایده ارائه شده، حاکی از افزایش چشمگیر سرعت یادگیری می­باشد.

Authors

فاطمه سعادت جو

دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر

عرفان قندهاری

دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • W.Böhmer, J. T.Springenberg, J.Boedecker, M.Riedmiller and K.Obermayer, Autonomous learning of ...
  • J. Kober, J. A. Bagnell and J. Peters, Reinforcement learning ...
  • T. P. Lillicrap, J. J. Hunt, A. Pritzel, N. Heess, ...
  • عادل اکبری مجد، حسین شایقی، حمید محمد نژاد، عبدااله یونسی، ...
  • Y. J. Liu, L. Tang, S. Tong, C. P. Chen ...
  • H. B.Ammar, E., Eaton, J. M., Luna and P.Ruvolo, Autonomous ...
  • A. Fachantidis, I. Partalas, G. Tsoumakas and I. Vlahavas, Transferring ...
  • M.Ghavamzadeh S.Mannor, J.Pineau and A. Tamar, Bayesian reinforcement learning: A ...
  • A. Gupta, C. Devin, Y. Liu, P. Abbeel and S. ...
  • O. Mohammed, G.Bailly and D.Pellier, Acquiring Human-Robot Interaction skills with ...
  • F. L.da Silva and A. H. R. Costa, Accelerating Multiagent ...
  • M. N. Ahmadabadi and M. Asadpour, Expertness based cooperative Q-learning, ...
  • K. Ito, A. Gofuku, Y. Imoto, and M. Takeshita, A ...
  • R. A. Bianchi, L. A. Celiberto, P. E. Santos, J. ...
  • Y. Hou, Y. S.Ong, L. Feng and J. M. Zurada, ...
  • Y. Duan, J. Schulman, X. Chen, P. L. Bartlett, I. ...
  • P. Tommasino, D. Caligiore, M. Mirolli and G. Baldassarre, A ...
  • G. F. Wang, Z. Fang, P. Li and B. Li, ...
  • R. Glatt, F. L. da Silva and A. H. R. ...
  • L. Zhou, P. Yang, C. Chen, Y. Gao, Multiagent reinforcement ...
  • T. Takano, H. Takase, H. Kawanaka and S. Tsuruoka, Preferential ...
  • G. Konidaris, I. Scheidwasser and A. Barto, Transfer in reinforcement ...
  • B. Banerjee and P. Stone, General Game Learning Using Knowledge ...
  • E. Ferrante, A. Lazaric, and M. Restelli, Transfer of task ...
  • A. Lazaric, Knowledge transfer in reinforcement learning, PhD thesis, Politecnico di ...
  • سیده ملیحه اخلاقی هاشمی پور، انتقال دانش در مسائل یادگیری ...
  • R. S. Sutton and A. G. Barto, Reinforcement Learning: An ...
  • G. Yen and T. Hickey, Reinforcement learning algorithms for robotic ...
  • A. Epshteyn and G. Dejong, Qualitative Reinforcement Learning, Proceedings of ...
  • J. Asmuth, M. L. Littman and R. Zinkov, Potential-based shaping ...
  • H. Van Hasselt, A. Guez and D. Silver, Deep Reinforcement ...
  • Q. Wang, L. Ruan and L. Si, Adaptive Knowledge Transfer ...
  • حسین مرادی فراهانی، جواد عسگری، طراحی کنترل­کننده عصبی- فازی نوع-۲، ...
  • A. Belaout, F. Krim, A. Mellit, B. Talbi and A. ...
  • A. Z. Kamil, S. Rustamov, M. A. Clements and E. ...
  • S. V. R. Termeh, A. Kornejady, H. R. Pourghasemi and ...
  • D. Wang, T. He, Z. Li, L. Cao, N. Dey, ...
  • نمایش کامل مراجع