بکارگیری آموزش تقویتی گسسته در فضای پیوسته با استفاده از ایده گسسته سازی تطبیقی

فاطمه آخوندی; الهه خانی; ولی درهمی

بکارگیری آموزش تقویتی گسسته در فضای پیوسته با استفاده از ایده گسسته سازی تطبیقی

Publish place: 15th Annual Conference of Computer Society of Iran

Publish Year: 1388

نوع سند: مقاله کنفرانسی

زبان: Persian

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/79086

شناسه ملی سند علمی:

CSICC15_153

تاریخ نمایه سازی: 26 مهر 1388

Abstract:

از آنجا که فضای حالت و عمل در آموزش تقویتی استانداردگسسته است، در بکارگیری آموزش تقویتی در مسائل با فضای حالت وعمل پیوسته لازم است که فضای حالت و عمل گسسته سازی شو ند.گسسته سازی نرم منجر به افزایش ابعاد فضای حالت و مشکلات منتجه از آن همچون کندی سرعت آموزش و تنگنای ابعاد می شود . در این مقاله یک راهکار جدید به نام گسسته سازی تطبیقی بر روی فضای عمل در آموزش تقویتی ارائه می شود. ایده مطرح شده از گسسته سازی با فواصل کوچک در کل فضا که منجر به افزایش سایز مجموعه عملها می گردد جلوگیری کرده و با کاوش های متوالی، دامنه مناسب برای گسسته سازی را می یابد. گسسته ساز یهای هوشمند و پی در پی ضمن جلوگیری از افزایش تعداد مجموعه عملها، منجر به یافتن مقدار بهینه عمل در هر حالت می شو د. لذا ضمن ثابت ماندن تعداد عملها درهرحالت، یک مقدار نزدیک به بهینه برای هرحالت پیدا می شود . ایده ارائه شده در الگوریتم آموزش کیو (Q_learning) در دو محیط قطعی و تصادفی بکار رفته و مورد تحلیل قرار می گیرد.

Keywords:

آموزش تقویتی , گسسته سازی تطبیقی , آموزش کیو

Authors

فاطمه آخوندی

دانشکده مهندسی برق و کامپیوتر دانشگاه یزد

الهه خانی

دانشکده مهندسی برق و کامپیوتر دانشگاه یزد

ولی درهمی

دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

ادرهمی ولی، جوهری مجد وحید، نیلی احمدآبادی مجید، بهبود آموزش ...
Sutton, R. S., Barto, A. G., _ Reinforcement Learning: An ...
Ten Hagen S., Krose B ., Q-Learning for systems with ...
Gaskett C., Wettergreen D., Zelinsky A., ; Advanced Topics in ...
Millan Jose Del R., Posenato D., Dedieu E., " Continuou ...
L. Jouffe, "Fuzzy inference system learning by reinforcemen methods", IEEE ...

نمایش کامل مراجع