ارائه یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت انتخاب خط مشی بهینه

Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,595

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IDMC02_042

تاریخ نمایه سازی: 14 فروردین 1388

Abstract:

در این مقاله یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت کنترل زمانبندی چراغهای راهنما پیشنهاد شده است. در الگوریتم های معمولی یک عامل منفرد یاد می گیرد که در طول چند اپیزود به یک هدف برسد. اگر مسئله یادگیری پیچیده باشد آنگاه ممکن است زمان محاسباتی بیشتری برای رسیدن به یک خط مشی بهینه صرف شود. در حالی که برای مسائل بهینه سازی ، روشهایی همانند الگوریتم ژنتیک و بهینه سازی گروه ذرات قادرند تا راه حل بهینه سراسری را برای چند تابع با فضای راه حل بزرگ و با سرعت بیشتر پیدا کنند. دراین مقاله ما از الگوریتم بهینه سازی گروه ذرات برای پیدا کردن خط مشی بهینه استفاده می کنیم. در این روش، عاملهای چندگانه با دو استراتژی بطور همزمان یاد می گیرند : یکی یادگیری انفرادی و دیگری یادگیری در طول مبادله اطلاعات، در استراتژی اخیر، هر عامل اطلاعات مربوط به ترافیک را به عاملهای مجاور می فرستد و هر عامل با توجه به اطلاعات دریافت شده از عاملهای دیگر و نیز اطلاعات خودش خط مشی بهینه را یاد می گیرد.

Keywords:

یادگیری تقویتی , بهینه سازی گروه ذرات , مدیریت ترافیک