سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده

Publish Year: 1399
Type: Conference paper
Language: Persian
View: 586

This Paper With 8 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

DCBDP06_009

Index date: 14 March 2021

دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده abstract

معمای زندانی یکی از مسائل اولیه و مهم در نظریه بازی ها است. در این معما برای عامل ها دو عمل همکاری و عدم همکاری وجود دارد که عامل ها بر اساس منافع شخصی خود یکی از اعمال مذکور را انتخاب می کنند . در معمای زندانی نقطه تعادل نشی وجود دارد و چنانچه عامل ها منطقی رفتار کنند در آن نقطه بازی می کنند؛ بدین منظور عامل ها برای دستیابی به سود بیشتر عدم همکاری راانتخاب می کنند. در حالی که برای عامل ها نقطه بهتری نسبت به نقطه نش وجود دارد و آن هم این است که هر دو عامل همکاری را انتخاب کنند. حال در جهت افزایش میزان همکاری عامل ها معمای زندانی به صورت معمای زندانی تکرارشونده با یک رویکرد یادگیری تقویتی در نظر گرفته شده است . رویکرد مورد نظر شامل دو مرحله است . مرحله اول آفلاین است: سیاس تها با درجه های مختلفهمکاری با یکدیگر تلفیق می شوند و سپس شبکه شناسایی، درجه همکاری را به عامل ها آموزش می دهد . مرحله دوم بصورت آنلاین است: یک عامل بر اساس میزان همکاری مشخص شده رقیب، استراتژی خود را انتخاب می کند. نتایج مقاله نشان دهنده این است که رویکرد مورد نظر سبب افزایش میزان همکاری عامل ها شده است و اگر عاملی همکاری را پیشه کند عامل دیگر نیز همکاری را انتخاب می کند و بالعکس .

دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده Keywords:

دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده authors

سمیرا فرزانه

دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، گروه آموزشی مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان

فرشته زندی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، گروه آموزشی مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان

جواد سلیمی سرتختی

عضو هیئت علمی، گروه آموزشی مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان

مقاله فارسی "دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده" توسط سمیرا فرزانه، دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، گروه آموزشی مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان؛ فرشته زندی، دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، گروه آموزشی مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان؛ جواد سلیمی سرتختی، عضو هیئت علمی، گروه آموزشی مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان نوشته شده و در سال 1399 پس از تایید کمیته علمی ششمین کنفرانس ملی محاسبات توزیعی و پردازش داده های بزرگ پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله عدم همکاری متقابل، معمای زندانی تکرارشونده، یادگیری تقویتی، همکاری متقابل LSTM(Long short term Memory) هستند. این مقاله در تاریخ 24 اسفند 1399 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 586 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که معمای زندانی یکی از مسائل اولیه و مهم در نظریه بازی ها است. در این معما برای عامل ها دو عمل همکاری و عدم همکاری وجود دارد که عامل ها بر اساس منافع شخصی خود یکی از اعمال مذکور را انتخاب می کنند . در معمای زندانی نقطه تعادل نشی وجود دارد و چنانچه عامل ها منطقی رفتار کنند در ... . برای دانلود فایل کامل مقاله دستیابی به همکاری از طریق یادگیری تقویتی چند عاملی در معمای زندانی تکرارشونده با 8 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.