طراحی یک سیستم هوشمند برای پارک کامیون بر مبنای یادگیری تقویتی و منطق فازی

Publish Year: 1389
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,591

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICFUZZYS10_037

تاریخ نمایه سازی: 9 شهریور 1391

Abstract:

در نمونه هایی از مسائل یادگیری تقویتی که فضای حالت ب هصورت پیوسته می باشد، استفاده از جدول مرجع برای نگهداری مقدارهای ارزش _ عمل به نظر غیر ممکن می رسد. در این گونه مسائل نیازمند راهکاری جهت تقریب ارزش به ازایهر زوج حالت -عمل می باشیم. ورودی این سیستم تقریب (ویژگی هایی از) متغیرهای حالتی است که وضعیت عامل در محیط را مشخص می کند. این سیستم می تواند خطی باشد یا غیر خطی. به ازای هر عضو از مجموعه عمل های عامل یکسیستم تقریب داریم که ارزش حالت به ازای عمل را مشخص می کند. از طرف دیگر در بسیاری از مسائل دنیای واقعی علاوه بر فضای حالات، فضای عمل های عامل نیز پیوسته م یباشد. در چنینمواردی استفاده از سیستم های فازی جهت استنتاج در فضای اعمال و انتخاب یک عمل نهایی می تواند سودمند باشد. در این قسمت سعی داریم با ترکیب الگوریتم یادگیری تقویتی و ترکیب دو ایده فازی کردن فضای اعمال و حالات و تقریب ارزش بایک سیستم خطی، سیستم هوشمندی جهت پارک کامیون 1 که هم فضای حالت و هم فضای عمل پیوسته دارد، معرفی نماییم. در نهایت نیز موفقیت الگوریتم پیشنهادی را با شبیه سازی های صورت گرفته بر روی مساله پارک کامیون نشان خواهیم داد.

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • R. Sutton and . G. Barto, Reinforcement Learning: An Introductio. ...
  • L. P. Kaelling, I.L. _ and A. V. Moore, Reinforcement ...
  • R. Sutton, Learning to predict by the methods of temporal ...
  • C. Vatkins and P. Dayan, Q-learning, Mach. Learn, xol. 8, ...
  • _ _ _ _ _ _ learning _ wireless _ ...
  • _ R. Beom and F. , Cho, A sensor-based navigation ...
  • C. I. Connolly, Harmonic functions _ collision probabilities, Int. J.Rob. ...
  • _ _ D. Stnart and L. P. Kaelling, Effective reinforcement ...
  • T. Kondo and , Ito, A reinforcement learning wvith evolutionary ...
  • M. Wiering and]. Schmidhuber, HQ-learning, Adapt. Behav, xol. 6, no. ...
  • _ G. Batto and S. NIahanevan, Recent advances in hierarchical ...
  • _ _ MDPs and semi-MDP, A framework for «emporal abstractin ...
  • _ Smith, Applications of the self-organising map to reinforcement learning, ...
  • P. Y. Glorennec and L. Joffe, Fuzzy Q-learning, in Proc. ...
  • نمایش کامل مراجع