بهبود یادگیری الگوریتم بهینه سازی ازدحام با رویکرد یادگیری تقویتی

Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 339

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

SASTECH09_052

تاریخ نمایه سازی: 11 اردیبهشت 1398

Abstract:

یکی از الگوریتم های مشهور هوش جمعی، الگوریتم PSO است که ابزار مناسب برای حل مسایل بهینه سازی سراسری می باشد. در بسیاری از الگوریتمهای بهینهسازی ازدحام ذرات، ذرات از الگوی یادگیری واحد استفاده میکنند؛ که باعث می شود ذره در موقعیت های مختلف پیچیده موفق عمل نکند. به منظور حل این مسایل، ذرات نیاز به یادگیری استراتژیهای مختلف برای مقابله با موقعیتهای مختلف؛ دارند. جهت بهبود این مسیله سراغ یادگیری تقویتی رفتیم که یکی از روش های یادگیری است که می تواند ایده ای نو برای هوشمندی بیشتر در عامل ها باشد. در روش پیشنهادی از Q-learning برای افزایش توانایی در جستجو جلوگیری از افتادن در بهینه محلی استفاده می شود. برای ارزیابی نتایج از تابع محک Ackley،Sphere ،Zakharov ،Sum Squares ،De Jong Function N. استفاده شده است. نتایج با الگوریتم PSO معمولی الگوریتم PSOآشوبی (CPSO) مقایسه شده است. از مشاهده نتایج دیده می شود که نرخ همگرایی بهتراز بقیه روش ها شده است همچنین بهینه سراسری واقعی تر نسبت به دیگر الگوریتم ها بدست آمده است.

Keywords:

الگوریتمQ-learning الگوریتم ازدحام ذرات (PSO) , بهینه سازی سراسری , یادگیری تقویتی

Authors

مرضیه یوسفی

دانشگاه آزاد اسلامی واحد بوشهر، گروه هوش مصنوعی، بوشهر، ایران

سیدمحمدحسین معطر

دانشگاه آزاد اسلامی واحد مشهد، گروه کامپیوتر-نرم افزار، مشهد، ایران