بهبود PSO با رویکرد یادگیری تقویتی آشوبی

مرضیه, یوسفی; سیدمحمدحسین, معطر

بهبود PSO با رویکرد یادگیری تقویتی آشوبی

عنوان مقاله: بهبود PSO با رویکرد یادگیری تقویتی آشوبی
شناسه ملی مقاله: SASTECH09_074
منتشر شده در نهمین سمپوزیوم بین المللی پیشرفتهای علوم و تکنولوژی در سال 1393

مشخصات نویسندگان مقاله:

مرضیه یوسفی - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد بوشهر، گروه هوش مصنوعی، بوشهر، ایران
سیدمحمدحسین معطر - استادیار دانشگاه آزاد اسلامی واحد مشهد، گروه کامپیوتر-نرم افزار، مشهد، ایران.

خلاصه مقاله:

الگوریتمهای تکاملی برای حل مسایل بهینه سازی سراسری مسایل بهینه سازی پویا، استفاده میشود. یکی از الگوریتم های تکاملی PSO می باشد که عیب آن این است که برای حل مسایل پیچیده چند وجهی به راحتی در بهینه محلی میافتد. برای حل مسیله سراغ یادگیری تقویتی رفتیم. یکی از ویژگیهای مهم روش های یادگیری تقویتی این است که بر خلاف بیشتر روش های یادگیری در این روش به عامل یادگیرنده گفته نمی شود که در هر موقعیتی کنش بهینه کدام کنش بوده است. در عوض این وظیفه عامل است که با تجربه کردن کنش های مختلف تشخیص دهد که کدامیک منجر به پاداش بیشتری می شوند کنش بهتری هستند. در روش پیشنهادی جهت بهبود PSO ابتدا آنرا آشوبی کرده سپس از الگوریتم Q-learning استفاده شده است. از آشوب جهت بهبود در سرعت همگرایی الگوریتم استفاده شده است. نتایج با الگوریتم PSO معمولی الگوریتم PSO آشوبی(CPSO )مقایسه شده است که نشان دهنده برتری الگوریتم پیشنهادی می باشد. جهت ارزیابی از تعدادی تابع محک استفاده شده است.

کلمات کلیدی:

آشوب، الگوریتمQ-learning الگوریتم ازدحام ذرات (PSO)، بهینه سازی سراسری، تفاضل زمانی، یادگیری تقویتی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/841500/