CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روشی نوین برای تنظیم وزن های یک کنترلگر عصبی با استفاده از آموزش تقویتی

عنوان مقاله: روشی نوین برای تنظیم وزن های یک کنترلگر عصبی با استفاده از آموزش تقویتی
شناسه ملی مقاله: ICS06_078
منتشر شده در ششمین کنفرانس سراسری سیستم های هوشمند در سال 1383
مشخصات نویسندگان مقاله:

ولی درهمی - بخش مهندسی برق -دانشکده فنی ومهندسی- دانشگاه تربیت مدرس-
وحید جوهری مجد

خلاصه مقاله:
در این مقاله یک روش جدید برای تنظیم پیوسته تمامی وزن های شبکه عصبی با استفاده از الگوریتمSRV اصلاح شده ارائه می گردد که به خطای خروجی کنترلگر و مشتق گیری نیاز ندارد وآموزش تنها با استفاده از یک سیگنال تقویتی اسکالر انجام می پذیرد . مقادیر جدید وزن ها در هر تکرار بصورت تصادفی بر اساس توزیع چگالی احتمال گوسی بدست می آید. تغییرات میانگین و انحراف معیار تابع توزیع احتمال به گونه ای است که با دریافت پاداش احتمال انتخاب مقادیر وزن کنونی تقویت و با دریافت جریمه کاهش می یابد . نتایج شبیه سازی برای مسأله کنترل گاری - اهرم توانایی روش ارایه شده را در تنظیم مناسب وزن های شبکه برای یک فرآیند ناپایدار و ناشناخته نشان می دهد . بطور مختصر مزایای روش ارایه شده را می توان به رهایی ا ز محدودیتهای مشتق گیری، آموزش تنها بر اساس سیگنال تقویتی، حجم کم محاسبات، و درجه اکتشاف مناسب آن نام برد

کلمات کلیدی:
آموزش تقویتی پیوسته، شبکه های عصبی، آموزش بدون سرپرست، کنترل گاری - اهرم

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/150488/