الگوریتمی خود یادگیر برای رهگیری هدف متحرک توسط گروهی از عامل های هوشمند
Publish place: 8th The National Conference of Command, Control, Communication and Computers & Intelligence (C4I)
Publish Year: 1393
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 765
This Paper With 8 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CCCI08_105
تاریخ نمایه سازی: 14 دی 1394
Abstract:
همکاری گرهی از عامل ها به منظور تامین یک هدف مشترک و ماکزیمم سازی منفعت جمعی مسئله ای بسیار پر کاربرد و مورد توجه می باشد در این مقاله مسئله رهگیری یک هدف متحرک توسط گروهی از عامل های خود مختار در یک فضای پیوسته مورد توجه قرار می گیرد.ترکیبی از یادگیری Qو کنترل فازی به عنوان پایه و اساس روش ارائه شده برای همکاری بین عامل ها در تعقیب هدف متحرک مطرح گردیده است مزیت اصلی یادگیری تقویتی آن است که سیستم با تعامل مستقیم با محیط و بدون در اختیار داشتن داده های آموزشی فبلی یادگیری را انجام می هدهد همچنین استفاده از روش کنترل فازی که زیر مجموعه ای از روشهای کنترل هوشمتد می باشند به دلیل کارایی فراوان در کنترل عامل های هوشمند در زمانی که مدل محیط بسیار پیجیده و یا در دسترس نیست در سالهای اخیر بسیار مورد توجه قرار گرفته است اشگال اصلی الگریتم یادگیری Q به منظور مدل سازی مسئله رهگیری در فضای پیوسته آن است که در این فضا تعداد حالات و اعمال پیش روی هر عامل بسیار زیاد می باشند لذا الگوریتم یادگیری Q ارائه شده توسط آقای واتکینز کارا نمی باشد.
Keywords:
Authors
اشکان مقدسی
دانشجوی کارشناسی ارشد رشته هوش مصنوعی
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :