روشی نوین برای تنظیم وزن های یک کنترلگر عصبی با استفاده از آموزش تقویتی
عنوان مقاله: روشی نوین برای تنظیم وزن های یک کنترلگر عصبی با استفاده از آموزش تقویتی
شناسه ملی مقاله: ICS06_078
منتشر شده در ششمین کنفرانس سراسری سیستم های هوشمند در سال 1383
شناسه ملی مقاله: ICS06_078
منتشر شده در ششمین کنفرانس سراسری سیستم های هوشمند در سال 1383
مشخصات نویسندگان مقاله:
ولی درهمی - بخش مهندسی برق -دانشکده فنی ومهندسی- دانشگاه تربیت مدرس-
وحید جوهری مجد
خلاصه مقاله:
ولی درهمی - بخش مهندسی برق -دانشکده فنی ومهندسی- دانشگاه تربیت مدرس-
وحید جوهری مجد
در این مقاله یک روش جدید برای تنظیم پیوسته تمامی وزن های شبکه عصبی با استفاده از الگوریتمSRV اصلاح شده ارائه می گردد که به خطای خروجی کنترلگر و مشتق گیری نیاز ندارد وآموزش تنها با استفاده از یک سیگنال تقویتی اسکالر انجام می پذیرد . مقادیر جدید وزن ها در هر تکرار بصورت تصادفی بر اساس توزیع چگالی احتمال گوسی بدست می آید. تغییرات میانگین و انحراف معیار تابع توزیع احتمال به گونه ای است که با دریافت پاداش احتمال انتخاب مقادیر وزن کنونی تقویت و با دریافت جریمه کاهش می یابد . نتایج شبیه سازی برای مسأله کنترل گاری - اهرم توانایی روش ارایه شده را در تنظیم مناسب وزن های شبکه برای یک فرآیند ناپایدار و ناشناخته نشان می دهد . بطور مختصر مزایای روش ارایه شده را می توان به رهایی ا ز محدودیتهای مشتق گیری، آموزش تنها بر اساس سیگنال تقویتی، حجم کم محاسبات، و درجه اکتشاف مناسب آن نام برد
کلمات کلیدی: آموزش تقویتی پیوسته، شبکه های عصبی، آموزش بدون سرپرست، کنترل گاری - اهرم
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/150488/