سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

یادگیری تقویتی برخط مبتنی بر سیاست برای توسعه خودکار منطق خودتطبیقی سیستم های خود تطبیق

Publish Year: 1401
Type: Journal paper
Language: Persian
View: 50

This Paper With 14 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

JR_KDIP-2-7_003

Index date: 3 December 2024

یادگیری تقویتی برخط مبتنی بر سیاست برای توسعه خودکار منطق خودتطبیقی سیستم های خود تطبیق abstract

- سیستم های خودتطبیق، قادرند با وجود تغییرات در محیط های پویا نیازمندی های کیفیشان را حفظ کنند. برای توسعه این سیستم ها، مهندسان باید بتوانند منطق خودتطبیقی که زمان و نحوه تطبیق سیستم را به شکل مناسبی بیان نماید، ایجاد کنند. توسعه منطق خودتطبیق سیستم ، به دلیل عدم قطعیت ها در زمان طراحی، دشوار است زیرا نمی توانیم تمام تغییرات محیطی بالقوه را پیش بینی کنیم. یادگیری تقویتی برخط با یاد گرفتن اثربخشی عملیات تطبیق از طریق تعامل سیستم با محیط در زمان اجرا، مشکل عدم قطعیت زمان طراحی را برطرف می کند، و میتواند توسعه منطق خودتطبیقی را بطور خودکار درآورد. روشهای یادگیری تقویتی برخط موجود برای توسعه سیستم های اطلاعاتی خودتطبیق، دو نقص دارند که درجه خودکارسازی را محدود می کند: ۱- نیازمند تنظیم دقیق نرخ اکتشاف بصورت دستی هستند و ۲- ممکن است برای تقویت مقیاس پذیری نیاز به کمی سازی حالت های محیطی به صورت دستی داشته باشد. در این مقاله رویکردی را برای خودکارسازی فعالیت های دستی فوق الذکر با استفاده از یادگیری تقویتی مبتنی بر سیاست، به عنوان نوع متفاوتی از یادگیری تقویتی معرفی می کنیم. امکان سنجی و کاربرد رویکرد را در توسعه منطق یک سیستم اطلاعاتی خودتطبیق نشان می دهیم.

یادگیری تقویتی برخط مبتنی بر سیاست برای توسعه خودکار منطق خودتطبیقی سیستم های خود تطبیق Keywords:

منطق خود تطبیق , یادگیری تقویتی برخط مبتنی بر سیاست , عدم قطعیت , سیستم خودتطبیق

یادگیری تقویتی برخط مبتنی بر سیاست برای توسعه خودکار منطق خودتطبیقی سیستم های خود تطبیق authors

کاظم نیکفرجام

عضو هیات علمی گروه کامپیوتر دانشگاه آزاد اسلامی واحد بیرجند