ارائه یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت انتخاب خط مشی بهینه

وحید چگنی; محمدابراهیم شیری

ارائه یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت انتخاب خط مشی بهینه

Publish place: 2nd Iran Data Mining Conference

Publish Year: 1387

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 11 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/70432

شناسه ملی سند علمی:

IDMC02_042

تاریخ نمایه سازی: 14 فروردین 1388

Abstract:

در این مقاله یک الگوریتم یادگیری تقویتی گروهی برای مدیریت اطلاعات ترافیک جهت کنترل زمانبندی چراغهای راهنما پیشنهاد شده است. در الگوریتم های معمولی یک عامل منفرد یاد می گیرد که در طول چند اپیزود به یک هدف برسد. اگر مسئله یادگیری پیچیده باشد آنگاه ممکن است زمان محاسباتی بیشتری برای رسیدن به یک خط مشی بهینه صرف شود. در حالی که برای مسائل بهینه سازی ، روشهایی همانند الگوریتم ژنتیک و بهینه سازی گروه ذرات قادرند تا راه حل بهینه سراسری را برای چند تابع با فضای راه حل بزرگ و با سرعت بیشتر پیدا کنند. دراین مقاله ما از الگوریتم بهینه سازی گروه ذرات برای پیدا کردن خط مشی بهینه استفاده می کنیم. در این روش، عاملهای چندگانه با دو استراتژی بطور همزمان یاد می گیرند : یکی یادگیری انفرادی و دیگری یادگیری در طول مبادله اطلاعات، در استراتژی اخیر، هر عامل اطلاعات مربوط به ترافیک را به عاملهای مجاور می فرستد و هر عامل با توجه به اطلاعات دریافت شده از عاملهای دیگر و نیز اطلاعات خودش خط مشی بهینه را یاد می گیرد.

Keywords:

یادگیری تقویتی , بهینه سازی گروه ذرات , مدیریت ترافیک

Authors

وحید چگنی

محمدابراهیم شیری