بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی
عنوان مقاله: بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی
شناسه ملی مقاله: JR_TJEE-49-3_014
منتشر شده در در سال 1398
شناسه ملی مقاله: JR_TJEE-49-3_014
منتشر شده در در سال 1398
مشخصات نویسندگان مقاله:
فاطمه سعادت جو - دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
عرفان قندهاری - دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
خلاصه مقاله:
فاطمه سعادت جو - دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
عرفان قندهاری - دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
این مقاله به موضوع انتقال یادگیری در محیطهایی که بعضی از ویژگیهای آن مشترک است میپردازد. چالش اصلی در این مبحث، نحوه انتقال دانش بهدستآمده از محیط مبدا به محیط مقصد است. در ایده ارائهشده با در نظرگرفتن ویژگیهای مشترک در فضای عامل بین دو محیط، ابتدا مقدار ارزش - عمل در محیط مبدا بهدست میآید، سپس از یک شبکه عصبی- فازی برای تقریب مقدار تابع ارزش - عمل بهره برده میشود. در محیط مقصد، مقدار ارزش - عمل از ترکیب مقدار پیشبینی شبکه عصبی - فازی و مقدار بهدستآمده در خود آن محیط استفاده میشود. به عبارت دیگر با توجه به آموزش انجام شده در محیط مبدا، مقادیر ارزش - عمل در محیط مقصد از ترکیب مقادیر ارزش - عمل تقریبزدهشده توسط شبکه عصبی - فازی و مقدار بهدست آمده از الگوریتم یادگیری در آن محیط بهدست میآید. شایان ذکر است که از الگوریتم یادگیری Q در محیط استفاده شده است. نتایج حاصل از ایده ارائه شده، حاکی از افزایش چشمگیر سرعت یادگیری میباشد.
کلمات کلیدی: یادگیری تقویتی, انتقال دانش, ویژگی مشترک, شبکه عصبی- فازی
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1697304/