CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی

عنوان مقاله: بهبود سرعت آموزش در مسائل یادگیری تقویتی مبتنی بر انتقال دانش عصبی فازی
شناسه ملی مقاله: JR_TJEE-49-3_014
منتشر شده در در سال 1398
مشخصات نویسندگان مقاله:

فاطمه سعادت جو - دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر
عرفان قندهاری - دانشکده مهندسی کامپیوتر - دانشگاه علم و هنر

خلاصه مقاله:
این مقاله به موضوع انتقال یادگیری در محیط­هایی که بعضی از ویژگی­های آن مشترک است می­پردازد. چالش اصلی در این مبحث، نحوه انتقال دانش به­دست­آمده از محیط مبدا به محیط مقصد است. در ایده ارائه­شده با در نظر­گرفتن ویژگی­های مشترک در فضای عامل بین دو محیط، ابتدا مقدار ارزش - عمل در محیط مبدا به­دست می­آید، سپس از یک شبکه عصبی- فازی برای تقریب مقدار تابع ارزش - عمل بهره برده میشود. در محیط مقصد، مقدار ارزش - عمل از ترکیب مقدار پیش­بینی شبکه عصبی - فازی و مقدار به­دست­آمده در خود آن محیط استفاده می­شود. به عبارت دیگر با توجه به آموزش انجام شده در محیط مبدا، مقادیر ارزش - عمل در محیط مقصد از ترکیب مقادیر ارزش - عمل تقریب­زده­شده توسط شبکه عصبی - فازی و مقدار به­دست آمده از الگوریتم یادگیری در آن محیط به­دست می­آید. شایان ذکر است که از الگوریتم یادگیری Q در محیط استفاده شده است. نتایج حاصل از ایده ارائه شده، حاکی از افزایش چشمگیر سرعت یادگیری می­باشد.

کلمات کلیدی:
یادگیری تقویتی, انتقال دانش, ویژگی مشترک, شبکه عصبی- فازی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1697304/