روشی نوین برای تنظیم وزن های یک کنترلگر عصبی با استفاده از آموزش تقویتی

ولی درهمی; وحید جوهری مجد

روشی نوین برای تنظیم وزن های یک کنترلگر عصبی با استفاده از آموزش تقویتی

Publish place: 6th Intelligent Systems Conference

Publish Year: 1383

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 6 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/150488

شناسه ملی سند علمی:

ICS06_078

تاریخ نمایه سازی: 18 تیر 1391

Abstract:

در این مقاله یک روش جدید برای تنظیم پیوسته تمامی وزن های شبکه عصبی با استفاده از الگوریتمSRV اصلاح شده ارائه می گردد که به خطای خروجی کنترلگر و مشتق گیری نیاز ندارد وآموزش تنها با استفاده از یک سیگنال تقویتی اسکالر انجام می پذیرد . مقادیر جدید وزن ها در هر تکرار بصورت تصادفی بر اساس توزیع چگالی احتمال گوسی بدست می آید. تغییرات میانگین و انحراف معیار تابع توزیع احتمال به گونه ای است که با دریافت پاداش احتمال انتخاب مقادیر وزن کنونی تقویت و با دریافت جریمه کاهش می یابد . نتایج شبیه سازی برای مسأله کنترل گاری - اهرم توانایی روش ارایه شده را در تنظیم مناسب وزن های شبکه برای یک فرآیند ناپایدار و ناشناخته نشان می دهد . بطور مختصر مزایای روش ارایه شده را می توان به رهایی ا ز محدودیتهای مشتق گیری، آموزش تنها بر اساس سیگنال تقویتی، حجم کم محاسبات، و درجه اکتشاف مناسب آن نام برد

Keywords:

آموزش تقویتی پیوسته , شبکه های عصبی , آموزش بدون سرپرست , کنترل گاری - اهرم

Authors

ولی درهمی

بخش مهندسی برق -دانشکده فنی ومهندسی- دانشگاه تربیت مدرس-

وحید جوهری مجد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

learning control by association and reinforcement, _ EEE Taas. _ ...
Neural Network-Like Critic for Reinforc ement Learnin, " Neuvra/ 4Aه ...
unsupervised learning of a layered network and its application 4Anه ...
Hasegawa, Y., Fukuda, T., and Shimojima, K. "Self-scaling reinforcemen learning ...
Sutton, R.S., and Barto, A.G. Reinforcement Learaing: An Introduction, " ...
Sutton, R. S., Barto, A. G., and Williams, R. J. ...
Hwang, K. S., and Chao, H. J., "Adaptive reinforcemet learning ...
Grant, E., and Zhang, B., "Neural network based reinforced learning, ...
Jang, J. S. R., Sun, C. T., and Mizutani, E., ...
Hwang, K.S, Tan, S.W., and Tsai, M. C., _ FReinforcement ...
Potocnil, P. and Grabec, I., "Adaptive self-tuning neurocontrol, " Mathematics ...
Samejima, K., and Omori, T., "Adaptive internal state space construction ...
Gullapalli, V., Franklin, J.A., and Benbrahim, H., "Acquiring robot skills ...
Gullapalli. V., _ stochastic reinforcement learning algorithm for learning real-valued ...
Barto, A..G., Sutton, R., and Anderson, C., W., "Neuronlike adaptive ...

نمایش کامل مراجع