بهبود PSO با رویکرد یادگیری تقویتی آشوبی
Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 296
This Paper With 12 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SASTECH09_074
تاریخ نمایه سازی: 11 اردیبهشت 1398
Abstract:
الگوریتمهای تکاملی برای حل مسایل بهینه سازی سراسری مسایل بهینه سازی پویا، استفاده میشود. یکی از الگوریتم های تکاملی PSO می باشد که عیب آن این است که برای حل مسایل پیچیده چند وجهی به راحتی در بهینه محلی میافتد. برای حل مسیله سراغ یادگیری تقویتی رفتیم. یکی از ویژگیهای مهم روش های یادگیری تقویتی این است که بر خلاف بیشتر روش های یادگیری در این روش به عامل یادگیرنده گفته نمی شود که در هر موقعیتی کنش بهینه کدام کنش بوده است. در عوض این وظیفه عامل است که با تجربه کردن کنش های مختلف تشخیص دهد که کدامیک منجر به پاداش بیشتری می شوند کنش بهتری هستند. در روش پیشنهادی جهت بهبود PSO ابتدا آنرا آشوبی کرده سپس از الگوریتم Q-learning استفاده شده است. از آشوب جهت بهبود در سرعت همگرایی الگوریتم استفاده شده است. نتایج با الگوریتم PSO معمولی الگوریتم PSO آشوبی(CPSO )مقایسه شده است که نشان دهنده برتری الگوریتم پیشنهادی می باشد. جهت ارزیابی از تعدادی تابع محک استفاده شده است.
Keywords:
آشوب , الگوریتمQ-learning الگوریتم ازدحام ذرات (PSO) , بهینه سازی سراسری , تفاضل زمانی , یادگیری تقویتی
Authors
مرضیه یوسفی
دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد بوشهر، گروه هوش مصنوعی، بوشهر، ایران
سیدمحمدحسین معطر
استادیار دانشگاه آزاد اسلامی واحد مشهد، گروه کامپیوتر-نرم افزار، مشهد، ایران.