روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

امیرمحمد مرادی; علیرضا برهانی داریان

روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

Publish place: international conference on civil engineering, architecture and Urban Sustainable Development

Publish Year: 1392

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/272796

شناسه ملی سند علمی:

ICCAU01_0840

تاریخ نمایه سازی: 29 تیر 1393

Abstract:

روش برنامه ریزی پویای استوکاستیک صریح (Stochastic Dynamic Programming) SDP برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققانهمواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش Q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یکسیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش SDP مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که Q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است

Keywords:

بهینه سازی استوکاستیک مخزن , یادگیری تقویتی , برنامه ریزی پویای استوکاستیک , سیاست بهره برداری

Authors

امیرمحمد مرادی

دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

علیرضا برهانی داریان

دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

International Conference _ Civil Engineering Architecture & Urban Sustainable Development ...
Lee J-H, Labadie JW. Stochastic optimization of multireservot systems via ...
Labadie JW. Optimal operation of multireservot system: State-of-the-ar review. Journal ...
Sutton RS, Barto AG. Reinforcemet Learning: An Introduction, MIT Press, ...
Wilson G. Reinforcemet learning: A new technique for the real-time ...
Bouchart FJ-C, Chkam H. A reinforcement learning model for the ...
Castelletti A, Corani G, Rizzoli A, Soncini-Sessa R, Weber E. ...
Bhattacharya A, Lobbrecht A, Solomatine D Neural networks and reinforcement ...
Mahootchi M, Tizhoosh HR, Ponnambalam K. Opp osition-based reinforcement learning ...
Castelletti A, Galelli S, Restelli M, Soncini-Sessa R. Tree-based reinforcement ...
Gosavi A, S imulated-based optimization: parametric optimization techniques and reinforcement ...
Kim Y-O, Palmer RN. Value of seasonal flow forcasts in ...

نمایش کامل مراجع