کنترل ردیاب وضعیت بهینه تحمل پذیر عیب کوادروتور در حضور قیود حالت و ورودی با استفاده از یادگیری تقویتی ایمن

Publish Year: 1403
نوع سند: مقاله ژورنالی
زبان: Persian
View: 56

This Paper With 20 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_MEASEJT-20-1_009

تاریخ نمایه سازی: 28 فروردین 1403

Abstract:

در این مقاله، به ارائه روشی جهت طراحی سیستم کنترل وضعیت ردیاب بهینه برای پرنده کوادروتور که در معرض عیوب اجزا و عملگر قرار دارد پرداخته شده است. روش کنترل تحمل پذیر عیب یکپارچه پیشنهادی مبتنی بر یادگیری تقویتی ایمن ارائه شده است و قادر است بدون نیاز به شناخت قبلی از دینامیک پرنده، قیود ورودی و حالات را تضمین نماید. به این منظور، روش بهینه پیشنهادی با ساختار شبکه عصبی دوگانه شامل شبکه های عصبی شناساگر-نقاد ارائه شده است. در قانون به روزرسانی وزن های شبکه شناساگر علاوه بر متغیر در نظر گرفتن ضریب فراموشی از روش پاسخ تجربه استفاده شده که باعث افزایش سرعت همگرایی و مقاومت نسبت به نویز اندازه گیری و کاهش خطای تخمین می شوند. در این روش، حل مسئله کنترل ردیاب وضعیت بهینه تحمل پذیر عیب در حالت مقید با حل مسئله پایدارسازی بهینه نامقید برای یک سیستم افزوده معادل می شود که در آن قیود ورودی کنترلی و حالات به ترتیب با انتخاب تابع هزینه مناسب بر سیگنال ورودی و توابع کنترل مانع مناسب بر حالات، تضمین داده می شوند. همچنین آشکارسازی وقوع عیب بدون نیاز به هیچ گونه بانکی از مدل یا فیلتر و صرفا با مقایسه مقدار باقی مانده معادله همیلتون-ژاکوبی-بلمن با یک آستانه از پیش تعیین شده انجام می پذیرد. پایداری فراگیر یکنواخت وزن های هر دو شبکه و درنتیجه همگرایی قانون کنترل به پاسخ بهینه با استفاده از قضیه لیاپانوف اثبات و با استفاده از نتایج شبیه سازی صحت عملکرد آن نشان داده شده است.

Keywords:

کنترل وضعیت کوادروتور , عیوب اجزا و عملگر , کنترل بهینه تحمل پذیر عیب , آشکارسازی وقوع عیب , یادگیری تقویتی ایمن

Authors

سجاد روشن روان

دانشجوی دکتری، دانشکده مهندسی برق، دانشگاه علم و صنعت ایران، تهران، ایران

سعید شمقدری

نویسنده مسئول: دانشیار، دانشکده مهندسی برق، دانشگاه علم و صنعت ایران، تهران، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Amirani MZ, Bigdeli N, Haeri M. Time varying formation control ...
  • Mahdavi F, Shamaghdari S. Optimal Formation Control for Unmanned Aerial ...
  • Zhao W, Liu H, Lewis FL. Data-driven fault-tolerant control for ...
  • Amin AA, Hasan KM. A review of fault tolerant control ...
  • Roshanravan S, Sobhani Gendeshmin B, Shamaghdari S. Design of an ...
  • Jiang J, Yu X. Fault-tolerant control systems: A comparative study ...
  • Rudin K, Ducard GJ, Siegwart RY. Active fault-tolerant control with ...
  • Lan J, Patton RJ. A new strategy for integration of ...
  • Roshanravan S, Shamaghdari S. Simultaneous fault detection and isolation and ...
  • Ruan Z, Yang Q, Ge SS, Sun Y. Performance-guaranteed fault-tolerant ...
  • Li L, Luo H, Ding SX, Yang Y, Peng K. ...
  • Cheng W, Zhang K, Jiang B. Hierarchical Structure-Based Fixed-Time Optimal ...
  • Bardi M, Dolcetta IC. Optimal control and viscosity solutions of ...
  • Lewis FL, Vrabie D. Reinforcement learning and adaptive dynamic programming ...
  • Huang J, Zeng W, Xiong H, Noack B, Hu G, ...
  • Bernini N, Bessa M, Delmas R, Gold A, Goubault E. ...
  • Zhu Y, Lian S, Zhong W, Meng, W. Reinforcement Learning Method ...
  • Yang Y, Vamvoudakis KG, Modares H, Yin Y, Wunsch DC. ...
  • Marvi Z, Kiumarsi B. Safe reinforcement learning: A control barrier ...
  • Al-Tamimi A, Lewis FL, Abu-Khalaf M. Discrete-time nonlinear HJB solution ...
  • Lv Y, Na J, Yang Q, Wu X, Guo Y. ...
  • Lv Y, Na J, Zhao X, Huang Y, Ren X. ...
  • Mishra A, Ghosh S. Simultaneous identification and optimal tracking control ...
  • Roshanravan S, Shamaghdari S. Adaptive fault-tolerant tracking control for affine ...
  • Dierks T, Jagannathan S, editors. Optimal control of affine nonlinear ...
  • Liu D, Yang X, Wang D, Wei Q. Reinforcement-learning-based robust ...
  • Yang H, Jiang B, Staroswiecki M. Supervisory fault tolerant control ...
  • Ma H-J, Xu L-X, Yang G-H. Multiple environment integral reinforcement ...
  • Choi YC, Ahn HS. Nonlinear control of quadrotor for point ...
  • Edwards C, Lombaerts T, Smaili H. Fault tolerant flight control. ...
  • Modares H, Lewis FL, Naghibi-Sistani M-B. Adaptive optimal control of ...
  • Na J, Mahyuddin MN, Herrmann G, Ren X, Barber P. ...
  • Modares H, Lewis FL. Optimal tracking control of nonlinear partially-unknown ...
  • Abu-Khalaf M, Lewis FL. Nearly optimal control laws for nonlinear ...
  • Modares H, Lewis FL, Naghibi-Sistani M-B. Integral reinforcement learning and ...
  • Stone M. The generalized Weierstrass approximation theorem. Mathematics Magazine. ۱۹۴۸;۲۱(۵): ...
  • Rudin W. Principles of mathematical analysis۱۹۵۳ ...
  • Ding SX. Model-based fault diagnosis techniques: design schemes, algorithms, and ...
  • نمایش کامل مراجع