روش یادگیری تقویتی دربهینه سازی استوکاستیک سیستم مخزن

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,225

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICCAU01_0840

تاریخ نمایه سازی: 29 تیر 1393

Abstract:

روش برنامه ریزی پویای استوکاستیک صریح (Stochastic Dynamic Programming) SDP برای حل مسایل پیچیده منابع آب با مشکلاتی نظیر بلای ابعادی و بلای مدلسازی مواجه می شود؛ این مساله موجب گردیده محققانهمواره در پی ارایه و توسعه روشهای مختلف برای حل مسایل بهینه سازی استوکاستیک سیستمهای منابع آب باشند. در این تحقیق روش Q-learning که یکی از تکنیک های الگوریتم یادگیری تقویتی است برای بهره برداری بهینه از یکسیستم مخزن پیشنهاد شده و سپس نتایج آن با نتایج حاصل از روش SDP مقایسه گردیده است. مقایسه سیاست های بهینه مستخرج از این دو روش نشان می دهد که Q-learning در برخورد با پدیده های استوکاستیک جریان رودخانه و مسئله عدم قطعیت دخیل در آن عملکرد بهتری داشته است

Keywords:

بهینه سازی استوکاستیک مخزن , یادگیری تقویتی , برنامه ریزی پویای استوکاستیک , سیاست بهره برداری

Authors

امیرمحمد مرادی

دانشجوی دکتری دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

علیرضا برهانی داریان

دانشیارمنابع آب دانشگاه صنعتی خواجه نصیرالدین طوسی دانشکده عمران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • International Conference _ Civil Engineering Architecture & Urban Sustainable Development ...
  • Lee J-H, Labadie JW. Stochastic optimization of multireservot systems via ...
  • Labadie JW. Optimal operation of multireservot system: State-of-the-ar review. Journal ...
  • Sutton RS, Barto AG. Reinforcemet Learning: An Introduction, MIT Press, ...
  • Wilson G. Reinforcemet learning: A new technique for the real-time ...
  • Bouchart FJ-C, Chkam H. A reinforcement learning model for the ...
  • Castelletti A, Corani G, Rizzoli A, Soncini-Sessa R, Weber E. ...
  • Bhattacharya A, Lobbrecht A, Solomatine D Neural networks and reinforcement ...
  • Mahootchi M, Tizhoosh HR, Ponnambalam K. Opp osition-based reinforcement learning ...
  • Castelletti A, Galelli S, Restelli M, Soncini-Sessa R. Tree-based reinforcement ...
  • Gosavi A, S imulated-based optimization: parametric optimization techniques and reinforcement ...
  • Kim Y-O, Palmer RN. Value of seasonal flow forcasts in ...
  • نمایش کامل مراجع