کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning

سجاد صابری; عباس چترایی; خوشنام شجاعی

سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning

Publish place: The first international conference and the seventh national conference on electrical engineering and intelligent systems

Publish Year: 1402

Type: Conference paper

Language: Persian

This Paper With 8 Page And PDF Format Ready To Download

DOWNLOAD Paper

Certificate
I'm the author of the paper

Export:

Link to this Paper:

https://civilica.com/doc/1963427

Document National Code:

NEEC07_055

Index date: 22 April 2024

کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning abstract

در این مقاله، کنترل بهینه سیستم های رباتیک با دینامیک نامعلوم با استفاده از روش یادگیری تقویتی ارائه شده است. از بین روش های مختلف یادگیری تقویتی، در اینجا از الگوریتم Q-Learning مبتنی بر تکنیک تکرار سیاست استفاده شده است. در این الگوریتم از ساختار بازیگر-منتقد بهره گرفته می شود، که بر اساس آن معادله غیرخطی همیلتون-یاکوبی-بلمن بطور بر خط و با استفاده از شبکه های عصبی حل شده است. در ضمن با وجود دینامیک نامعلوم پلنت، مسئله کنترل بهینه با مینیمایز کردن تابع هزینه حل می گردد. روش ارائه شده بر روی ربات تک لینکی به کار رفته و در نرم افزار متلب شبیه سازی شده است.

کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning Keywords:

تکرار سیاست , ربات تک لینکی غیرخطی , روش Q-Learning , کنترل بهینه , یادگیری تقویتی

کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning authors

سجاد صابری

دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران

عباس چترایی

دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران

خوشنام شجاعی

دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایرانمرکز تحقیقات پردازش و دیجیتال و بینایی ماشین، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران

Certificate
I'm the author of the paper

Export:

Link to this Paper:

https://civilica.com/doc/1963427

Document National Code:

NEEC07_055

Index date: 22 April 2024

How to cite:

If you want to refer to this Paper in your research work, you can simply use the following phrase in the references section:

صابری، سجاد و چترایی، عباس و شجاعی، خوشنام،1402،کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning،The first international conference and the seventh national conference on electrical engineering and intelligent systems،Najafabad،https://civilica.com/doc/1963427

در داخل متن نیز هر جا که به عبارت و یا دستاوردی از این Paper اشاره شود پس از ذکر مطلب، در داخل پارانتز، مشخصات زیر نوشته می شود.
برای بار اول: (1402، صابری، سجاد؛ عباس چترایی و خوشنام شجاعی)
برای بار دوم به بعد: (1402، صابری؛ چترایی و شجاعی)
برای آشنایی کامل با نحوه مرجع نویسی لطفا بخش راهنمای سیویلیکا (مرجع دهی) را ملاحظه نمایید.

Scientometrics

The specifications of the publisher center of this Paper are as follows:

Ranking of Islamic Azad University of NajafAbad

Type of center: دانشگاه آزاد

Paper count: 14,002

In the scientometrics section of CIVILICA, you can see the scientific ranking of the Iranian academic and research centers based on the statistics of indexed articles.

Related papers

پیش نمایش

مقاله فارسی "کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning" توسط سجاد صابری، دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران؛ عباس چترایی، دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران؛ خوشنام شجاعی، دانشکده مهندسی برق، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایرانمرکز تحقیقات پردازش و دیجیتال و بینایی ماشین، دانشگاه آزاد اسلامی، واحد نجف آباد، نجف آباد، ایران نوشته شده و در سال 1402 پس از تایید کمیته علمی اولین کنفرانس بین المللی و هفتمین کنفرانس ملی مهندسی برق و سیستم های هوشمند پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله تکرار سیاست، ربات تک لینکی غیرخطی، روش Q-Learning، کنترل بهینه، یادگیری تقویتی هستند. این مقاله در تاریخ 3 اردیبهشت 1403 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 444 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که در این مقاله، کنترل بهینه سیستم های رباتیک با دینامیک نامعلوم با استفاده از روش یادگیری تقویتی ارائه شده است. از بین روش های مختلف یادگیری تقویتی، در اینجا از الگوریتم Q-Learning مبتنی بر تکنیک تکرار سیاست استفاده شده است. در این الگوریتم از ساختار بازیگر-منتقد بهره گرفته می شود، که بر اساس آن معادله غیرخطی همیلتون-یاکوبی-بلمن بطور بر خط ... . برای دانلود فایل کامل مقاله کنترل بهینه ربات تک لینکی غیرخطی به روش یادگیری تقویتی Q-Learning با 8 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.