بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی

فاطمه سعادت جو; عرفان قندهاری

بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی

Publish place: Tabriz Journal of Electrical Engineering، Vol: 49، Issue: 3

Publish Year: 1398

نوع سند: مقاله ژورنالی

زبان: Persian

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1697304

شناسه ملی سند علمی:

JR_TJEE-49-3_014

تاریخ نمایه سازی: 27 تیر 1402

Abstract:

این مقاله به موضوع انتقال یادگیری در محیطهایی که بعضی از ویژگیهای آن مشترک است میپردازد. چالش اصلی در این مبحث، نحوه انتقال دانش بهدستآمده از محیط مبدا به محیط مقصد است. در ایده ارائهشده با در نظرگرفتن ویژگیهای مشترک در فضای عامل بین دو محیط، ابتدا مقدار ارزش - عمل در محیط مبدا بهدست میآید، سپس از یک شبکه عصبی- فازی برای تقریب مقدار تابع ارزش - عمل بهره برده میشود. در محیط مقصد، مقدار ارزش - عمل از ترکیب مقدار پیشبینی شبکه عصبی - فازی و مقدار بهدستآمده در خود آن محیط استفاده میشود. به عبارت دیگر با توجه به آموزش انجام شده در محیط مبدا، مقادیر ارزش - عمل در محیط مقصد از ترکیب مقادیر ارزش - عمل تقریبزدهشده توسط شبکه عصبی - فازی و مقدار بهدست آمده از الگوریتم یادگیری در آن محیط بهدست میآید. شایان ذکر است که از الگوریتم یادگیری Q در محیط استفاده شده است. نتایج حاصل از ایده ارائه شده، حاکی از افزایش چشمگیر سرعت یادگیری میباشد.

Keywords:

یادگیری تقویتی , انتقال دانش , ویژگی مشترک , شبکه عصبی- فازی

Authors

فاطمه سعادت جو

دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر

عرفان قندهاری

دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

W.Böhmer, J. T.Springenberg, J.Boedecker, M.Riedmiller and K.Obermayer, Autonomous learning of ...
J. Kober, J. A. Bagnell and J. Peters, Reinforcement learning ...
T. P. Lillicrap, J. J. Hunt, A. Pritzel, N. Heess, ...
عادل اکبری مجد، حسین شایقی، حمید محمد نژاد، عبدااله یونسی، ...
Y. J. Liu, L. Tang, S. Tong, C. P. Chen ...
H. B.Ammar, E., Eaton, J. M., Luna and P.Ruvolo, Autonomous ...
A. Fachantidis, I. Partalas, G. Tsoumakas and I. Vlahavas, Transferring ...
M.Ghavamzadeh S.Mannor, J.Pineau and A. Tamar, Bayesian reinforcement learning: A ...
A. Gupta, C. Devin, Y. Liu, P. Abbeel and S. ...
O. Mohammed, G.Bailly and D.Pellier, Acquiring Human-Robot Interaction skills with ...
F. L.da Silva and A. H. R. Costa, Accelerating Multiagent ...
M. N. Ahmadabadi and M. Asadpour, Expertness based cooperative Q-learning, ...
K. Ito, A. Gofuku, Y. Imoto, and M. Takeshita, A ...
R. A. Bianchi, L. A. Celiberto, P. E. Santos, J. ...
Y. Hou, Y. S.Ong, L. Feng and J. M. Zurada, ...
Y. Duan, J. Schulman, X. Chen, P. L. Bartlett, I. ...
P. Tommasino, D. Caligiore, M. Mirolli and G. Baldassarre, A ...
G. F. Wang, Z. Fang, P. Li and B. Li, ...
R. Glatt, F. L. da Silva and A. H. R. ...
L. Zhou, P. Yang, C. Chen, Y. Gao, Multiagent reinforcement ...
T. Takano, H. Takase, H. Kawanaka and S. Tsuruoka, Preferential ...
G. Konidaris, I. Scheidwasser and A. Barto, Transfer in reinforcement ...
B. Banerjee and P. Stone, General Game Learning Using Knowledge ...
E. Ferrante, A. Lazaric, and M. Restelli, Transfer of task ...
A. Lazaric, Knowledge transfer in reinforcement learning, PhD thesis, Politecnico di ...
سیده ملیحه اخلاقی هاشمی پور، انتقال دانش در مسائل یادگیری ...
R. S. Sutton and A. G. Barto, Reinforcement Learning: An ...
G. Yen and T. Hickey, Reinforcement learning algorithms for robotic ...
A. Epshteyn and G. Dejong, Qualitative Reinforcement Learning, Proceedings of ...
J. Asmuth, M. L. Littman and R. Zinkov, Potential-based shaping ...
H. Van Hasselt, A. Guez and D. Silver, Deep Reinforcement ...
Q. Wang, L. Ruan and L. Si, Adaptive Knowledge Transfer ...
حسین مرادی فراهانی، جواد عسگری، طراحی کنترلکننده عصبی- فازی نوع-۲، ...
A. Belaout, F. Krim, A. Mellit, B. Talbi and A. ...
A. Z. Kamil, S. Rustamov, M. A. Clements and E. ...
S. V. R. Termeh, A. Kornejady, H. R. Pourghasemi and ...
D. Wang, T. He, Z. Li, L. Cao, N. Dey, ...

نمایش کامل مراجع