سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند

Publish Year: 1401
Type: Journal paper
Language: Persian
View: 252
این Paper فقط به صورت چکیده توسط دبیرخانه ارسال شده است و فایل کامل قابل دریافت نیست. برای یافتن Papers دارای فایل کامل، از بخش [جستجوی مقالات فارسی] اقدام فرمایید.

نسخه کامل این Paper ارائه نشده است و در دسترس نمی باشد

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

Export:

Link to this Paper:

Document National Code:

JR_JICTP-3-9_009

Index date: 23 July 2022

ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند abstract

توسعه و استفاده از روش های مختلف هوش مصنوعی برای حل مسائل مختلف، یک زمینه تحقیقاتی وسیع و فعال در عصر جدید فناوری می باشد. مسئله ی تعقیب و گریز به عنوان یک مسئله ی نمونه در بسیاری از تحقیقات جدید مربوط به یادگیری ماشین و هوش مصنوعی استفاده شده است. در شکل خاصی از مسئله ی تعقیب و گریز یعنی مسئله ی دزد و پلیس که موردبررسی این تحقیق است، تعدادی عامل پلیس در تعقیب عامل های دیگر هستند. هدف این تحقیق، آموزش دو عامل هوشمند پلیس با استفاده از شبکه های یادگیری عمیق Q است به نحوی که بتوانند در کمترین زمان ممکن، سارق (عامل فرارکننده) را به موقعیت مشخصی برگردانند. در این تحقیق دو مدل با استفاده از الگوریتم مذکور در دو سناریوی مختلف برای یادگیری از تجربه های عامل های پلیس، ارائه شده و درنهایت عملکرد مدل های پیشنهادی از طریق مقایسه با الگوریتم دقیق جستجوی فراگیر مورد تست و ارزیابی قرار گرفتند. پس از آموزش عامل ها، مشاهده شد که در هر دو سناریو به تدریج میزان هزینه شبکه ها کاهش و میزان پاداش های دریافتی توسط پلیس ها در انتهای آموزش افزایش می یابند و به مقادیر مشخصی همگرا می شوند. در سناریوی اول عامل های پلیس در برگرداندن سارق به موقعیت مشخص، کاملا موفق عمل می کنند و در سناریوی دوم نیز در بیش از ۹۰ درصد محیط های تصادفی، این عمل را با موفقیت انجام می دهند.

ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند Keywords:

ارائه الگوریتم یادگیری تقویتی عمیق در مسئله تعقیب و گریز برای پلیس هوشمند authors

علی امینی باغ

سیستم های اطلاعات جغرافیایی، خواجه نصیرالدین طوسی، تهران، ایران

محمدسعدی مسگری

سیستم های اطلاعات جغرافیایی، دانشکده نقشه برداری، دانشگاه خواجه نصیرالدین طوسی، تهران، ایران

پویا محمدی کزج

سیستم های اطلاعات جغرافیایی، دانشکده نقشه برداری، دانشگاه خواجه نصیرالدین طوسی، تهران، ایران