استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی

فاطمه, سارانی راد; علی, اکرمی زاده

استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی

عنوان مقاله: استفاده ازشکل دهی پاداش دریادگیری مشارکتی مبتنی برخبرگی
شناسه ملی مقاله: ICS12_158
منتشر شده در دوازدهمین کنفرانس ملی سیستم های هوشمند ایران در سال 1392

مشخصات نویسندگان مقاله:

فاطمه سارانی راد - دانشجوی کارشناسی ارشدعلوم تصمیم ومهندسی دانش دانشگاه علوم اقتصادی تهران
علی اکرمی زاده - استادیارگروه مهندسی برق و کامپیوتردانشگاه صنعتی خواجه نصیرالدین طوسی تهران

خلاصه مقاله:

استفاده ازتجربه های عاملهای دیگردریک محیط چندعامله باعث میشود که یک عامل کمتردچاراشتباه و خطا شود و ازتجربه های عاملهای دیگردربدست اوردن حداکثر کارایی استفاده کند برای استفاده ازدانش صحیح عاملهای دیگردرطی فرایندیادگیری ازیکسری معیارهای سنجش خبرگی عاملها استفاده میشود همچنین برای تسریع فرایندیادگیری دریادگیری تقویتی ازتکنیک شکل دهی پاداش استفاده میشود دراین مقاله یک روش ترکیبی جدید مبتنی برشکل دهی پاداش و اشتراک وزن داراستراتژی درطی فرایند یادگیری دریک محیط چندعامله پیشنهادداده شده است روش پیشنهادی موجب تسریع فرایندیادگیری و دستیابی به حداکثر پاداش شده است نتایج تجربی کارایی روش پیشنهادی درفرایند یادگیری روی محیط شبیه سازی را نشان میدهد

کلمات کلیدی:

یادگیری تقویتی ، شکل دهی پاداش ، سیستم چندعامله ، یادگیری Q

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/276238/