توسعه خودکار منطق خودتطبیقی سیستم های خود تطبیق به کمک یادگیری تقویتی برخط مبتنیبر سیاست

کاظم نیک فرجام

توسعه خودکار منطق خودتطبیقی سیستم های خود تطبیق به کمک یادگیری تقویتی برخط مبتنیبر سیاست

Publish place: Eighth international Conference on Knowledge and Technology of Mechanical, Electrical Engineering and Computer Of Iran

Publish Year: 1401

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 15 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1637809

شناسه ملی سند علمی:

DMECONF08_113

تاریخ نمایه سازی: 31 فروردین 1402

Abstract:

سیستمهای خودتطبیق، قادرند با وجود تغییرات در محیط های پویا نیازمندی های کیفیشان را حفظ کنند. برای توسعه این سیستم ها، مهندسان باید بتوانند منطق خودتطبیقی که زمان و نحوه تطبیق سیستم را به شکل مناسبی بیان نماید، ایجاد کنند. توسعه منطق خودتطبیق سیستم ، به دلیل عدم قطعیت ها در زمان طراحی، دشوار است زیرا نمی توانیم تمام تغییرات محیطی بالقوه را پیش بینی کنیم. یادگیری تقویتی برخط با یاد گرفتن اثربخشی عملیات تطبیق از طریق تعامل سیستم با محیط در زمان اجرا، مشکل عدم قطعیت زمان طراحی را برطرف می کند، و میتواند توسعه منطق خودتطبیقی را بطور خودکار درآورد. روشهای یادگیری تقویتی برخط موجود برای توسعه سیستم های خودتطبیق، دو نقص دارند که درجه خودکارسازی را محدود می کند: -۱ نیازمند تنظیم دقیق نرخ اکتشاف بصورت دستی هستند و -۲ ممکن است برای تقویت مقیاس پذیری نیاز به کمی سازی حالت های محیطی به صورت دستی داشته باشد. در این مقاله رویکردی را برای خودکارسازی فعالیتهای دستی فوقالذکر با استفاده از یادگیری تقویتی مبتنی بر سیاست، به عنوان نوع متفاوتی از یادگیری تقویتی معرفی میکنیم. امکان سنجی و کاربرد رویکرد را در توسعه منطق یک سیستم اطلاعاتی خودتطبیق نشان می دهیم.

Keywords:

حداکثر منطق خود تطبیق , یادگیری تقویتی برخط مبتنی بر سیاست , عدم قطعیت , سیستم خودتطبیق.

Authors

کاظم نیک فرجام

دانشجوی دکترای دانشگاه آزاد اسلامی – واحد قزوین