بهبود PSO با رویکرد یادگیری تقویتی آشوبی

مرضیه یوسفی; سیدمحمدحسین معطر

بهبود PSO با رویکرد یادگیری تقویتی آشوبی

Publish place: Ninth International Symposium on Science and Technology Advances

Publish Year: 1393

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 12 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/841500

شناسه ملی سند علمی:

SASTECH09_074

تاریخ نمایه سازی: 11 اردیبهشت 1398

Abstract:

الگوریتمهای تکاملی برای حل مسایل بهینه سازی سراسری مسایل بهینه سازی پویا، استفاده میشود. یکی از الگوریتم های تکاملی PSO می باشد که عیب آن این است که برای حل مسایل پیچیده چند وجهی به راحتی در بهینه محلی میافتد. برای حل مسیله سراغ یادگیری تقویتی رفتیم. یکی از ویژگیهای مهم روش های یادگیری تقویتی این است که بر خلاف بیشتر روش های یادگیری در این روش به عامل یادگیرنده گفته نمی شود که در هر موقعیتی کنش بهینه کدام کنش بوده است. در عوض این وظیفه عامل است که با تجربه کردن کنش های مختلف تشخیص دهد که کدامیک منجر به پاداش بیشتری می شوند کنش بهتری هستند. در روش پیشنهادی جهت بهبود PSO ابتدا آنرا آشوبی کرده سپس از الگوریتم Q-learning استفاده شده است. از آشوب جهت بهبود در سرعت همگرایی الگوریتم استفاده شده است. نتایج با الگوریتم PSO معمولی الگوریتم PSO آشوبی(CPSO )مقایسه شده است که نشان دهنده برتری الگوریتم پیشنهادی می باشد. جهت ارزیابی از تعدادی تابع محک استفاده شده است.

Keywords:

آشوب , الگوریتمQ-learning الگوریتم ازدحام ذرات (PSO) , بهینه سازی سراسری , تفاضل زمانی , یادگیری تقویتی

Authors

مرضیه یوسفی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد بوشهر، گروه هوش مصنوعی، بوشهر، ایران

سیدمحمدحسین معطر

استادیار دانشگاه آزاد اسلامی واحد مشهد، گروه کامپیوتر-نرم افزار، مشهد، ایران.