کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning
Publish place: The first international conference and the seventh national conference on electrical engineering and intelligent systems
Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 233
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NEEC07_055
تاریخ نمایه سازی: 3 اردیبهشت 1403
Abstract:
در این مقاله، کنترل بهینه سیستم های رباتیک با دینامیک نامعلوم با استفاده از روش یادگیری تقویتی ارائه شده است. از بین روش های مختلف یادگیری تقویتی، در اینجا از الگوریتم Q-Learning مبتنی بر تکنیک تکرار سیاست استفاده شده است. در این الگوریتم از ساختار بازیگر-منتقد بهره گرفته می شود، که بر اساس آن معادله غیرخطی همیلتون-یاکوبی-بلمن بطور بر خط و با استفاده از شبکه های عصبی حل شده است. در ضمن با وجود دینامیک نامعلوم پلنت، مسئله کنترل بهینه با مینیمایز کردن تابع هزینه حل می گردد. روش ارائه شده بر روی ربات تک لینکی به کار رفته و در نرم افزار متلب شبیه سازی شده است.
Keywords:
Authors
سجاد صابری
دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران
عباس چترایی
دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران
خوشنام شجاعی
دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایرانمرکز تحقیقات پردازش و دیجیتال و بینایی ماشین، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران