استفاده از
یادگیری تقویتی در حوزه آموزش، این پتانسیل را دارد که تغییر قابل توجهی در رویکرد و مشارکت دانش آموزان با یادگیری و نحوه ارزیابی معلمان از پیشرفت دانش آموزان ایجاد کند. استفاده از
یادگیری تقویتی در
آموزش امکان یادگیری شخصی و انطباقی را فراهم می کند، جایی که سطح دشواری را می توان بر اساس عملکرد دانش آموز تنظیم کرد. در نتیجه، این می تواند منجر به افزایش سطح انگیزه و مشارکت در بین دانش آموزان شود. هدف این مقاله بررسی کاربردها و تکنیک-های
یادگیری تقویتی در
آموزش و تعیین تاثیر بالقوه آن بر افزایش نتایج آموزشی است. این سیاست های مختلف القا شده توسط
یادگیری تقویتی را با خطوط پایه مقایسه می کند و چهار تکنیک
یادگیری تقویتی متمایز را شناسایی می کند: فرآیند تصمیم گیری مارکوف، فرآیند تصمیم گیری مارکوف تا حدی قابل مشاهده، شبکه
یادگیری تقویتی عمیق، و زنجیره مارکوف، و همچنین کاربرد آنها در آموزش. تمرکز اصلی مقاله شناسایی بهترین شیوه ها برای گنجاندن
یادگیری تقویتی در محیط های آموزشی برای دستیابی به نتایج موثر و مفید است. امید است یافته های این مطالعه بتواند معیاری برای مقایسه سودمندی و اثربخشی الگوریتم های رایج
یادگیری تقویتی در اختیار محققان جهت تحقیقات آینده در
آموزش را ارائه دهد.