طراحی یک عامل یادگیری تقویتی برای نگاشت یادگیری مبتنی بربازخورد محیط

بابک بادنوا; ناصر مزینی

طراحی یک عامل یادگیری تقویتی برای نگاشت یادگیری مبتنی بربازخورد محیط

Publish place: Digital Games Research Conference (DGRC)

Publish Year: 1396

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/696856

شناسه ملی سند علمی:

DGRCONF01_013

تاریخ نمایه سازی: 7 اسفند 1396

Abstract:

در بسیاری از وظایف محوله به یک عامل شباهتهایی موجود میباشد که عامل میتواند از این شباهتها استفاده نموده تا نیاز به یادگیری مجدد این مهارتها نداشته باشد، از طرفی دیگر عامل در فرآیند یادگیری یک وظیفه دانشی را نیز کسب مینماید که میتواند از آن در انجام وظایف دیگر استفاده نماید. در این مقاله ما به ارایه روشی برای آموزش یک نگاشت به عامل یادگیری تقویتی با استفاده از بازخوردهای محیطی میپردازیم و نشان خواهیم داد که با شکل دهی به تابع پاداش یک عامل یادگیر تقویتی میتوان به عامل، نگاشت از فضای حالتی به فضای حالت دیگر را آموزش داده و از این نتیجه نیز در انتقال یادگیری تقویتی استفاده نمود. پس از ارایه روش ما به پیادهسازی و آزمون روش ارایه شده بر روی بازیBreakout نمودهایم و مشاهده میکنیم که این عامل به خوبی توانسته است نگاشت اعمال یک عامل را آموزش ببیند

Keywords:

انتقال یادگیری , یادگیری تقویتی , نگاشت , شکل دهی تابع پاداش

Authors

بابک بادنوا

دانشجوی مقطع کارشناسی ارشد رشته هوش مصنوعی و رباتیکز دانشکده مهندسی کامپیوتر در دانشگاه علم و صنعت ایران

ناصر مزینی

دانشیار گروه هوش مصنوعی و رباتیکز دانشکده مهندسی کامپیوتر در دانشگاه علم و صنعت ایران