CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

هم زمانی خوشه در بازی های گرافی زمان گسسته ورودی محدود ناشناخته با الگوریتم های یادگیری تقویتی

عنوان مقاله: هم زمانی خوشه در بازی های گرافی زمان گسسته ورودی محدود ناشناخته با الگوریتم های یادگیری تقویتی
شناسه ملی مقاله: AISC01_091
منتشر شده در اولین کنفرانس هوش مصنوعی و پردازش هوشمند در سال 1401
مشخصات نویسندگان مقاله:

زهرا جهان - دانشجوی دکترای مهندسی برق-کنترل دانشگاه سمنان
عباس دیدبان - دانشیار دانشکده مهندسی برق دانشگاه سمنان
مصطفی عرب خابوری - فارغ التحصیل کارشناسی ارشد مهندسی برق-کنترل دانشگاه سمنان

خلاصه مقاله:
در این مقاله، مساله هم زمانی عامل ها در هر خوشه برای بازی های گرافی زمان گسسته چند عاملی با محدودیت ورودی و دینامیک ناشناخته معرفی شده است. هدف طراحی کنترلر برای رسیدن به همزمانی خوشه و اطمینان از بهینگی محلی شاخص عملکرد است. به همین منظور یک الگوریتم بهینه توزیع شده بر مبنای برنامه ریزی پویای تطبیقی تکرار ارزش توسعه داده شده است تا معادلات همیلتون ژاکوبی بلمن را بدون نیاز به هیچ دانشی از دینامیک های سیستم حل کند. برای اجرای الگوریتم ارائه شده، هر یک از بازیکنان از ساختار شبکه عصبی نقاد-عملگر استفاده می کنند. همچنین یک شناساگر شبکه عصبی برای شناسایی دینامیک های ناشناخته هر عامل اعمال شده است. برای اجتناب از ناپایداری سیستم، محدودیت بر روی ورودی کنترل در روش طراحی در نظر گرفته شده است. همچنین پایداری سیستم حلقه بسته نشان داده شده است. در انتها، نتایج شبیه سازی برای توصیف کارایی روش ارائه شده آورده شده است

کلمات کلیدی:
هم زمانی خوشه، بازی های گرافی زمان گسسته، شبکه های عصبی، محدودیت ورودی کنترل، دینامیک ناشناخته

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1549655/