طراحی سازوکار تدارکات براساس یادگیری Q و با سیاست انتخاب عمل مبتنی بر الگوریتم ازدحام ذرات

زهره کاهه; رضا برادران کاظم زاده

طراحی سازوکار تدارکات براساس یادگیری Q و با سیاست انتخاب عمل مبتنی بر الگوریتم ازدحام ذرات

Publish place: Supply Chain Management، Vol: 18، Issue: 51

Publish Year: 1395

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/980955

شناسه ملی سند علمی:

JR_SCMJ-18-51_004

تاریخ نمایه سازی: 2 بهمن 1398

Abstract:

در این مقاله، مسئله مناقصه در یک شرکت خودروسازی برای تدارک قطعات مورد نیاز از تامین کنندگان بالقوه از طریق الگوریتم یادگیری Q حل شده است. در این مسئله، خریدار با توجه به پیشنهادات دریافتی از تامین کنندگان بالقوه که شامل قیمت و زمان تحویل پیشنهادی است، سفارش قطعات مورد نیاز خود را به تامین کنندگان تخصیص می دهد. هدف خریدار کمینه سازی هزینه های تدارکات از طریق یادگیری از مناقصات پیشین است. این مسئله به صورت یک مسئله تصمیم گیری مارکوفی تعریف شده است که در آن هر عمل وابسته به عمل و وضعیت قبلی است. برای حل این مسئله یک الگوریتم یادگیری تقویتی به نام الگوریتم یادگیری Q توسعه داده شده است که در آن از الگوریتم بهینهسازی ازدحام ذرات به عنوان راهکاری برای یافتن و انتخاب سیاست بهینه برای انتخاب عمل در الگوریتم یادگیری Q استفاده شده است. در مقایسه این الگوریتم با حالتی که در آن سیاست انتخاب عمل مطابق با یک الگوریتم حریصانه است، این الگوریتم بسیار کارآمدتر است.

Keywords:

تدارکات , یادگیری تقویتی , الگوریتم یادگیری Q , سیاست انتخاب عمل

Authors

زهره کاهه

دانشگاه تربیت مدرس

رضا برادران کاظم زاده

دانشگاه تربیت مدرس

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Chopra, Sunil, and Peter Meindl. , Supply chain management . ...
Bichler,M. and Kalagnanam,J., A nonoparametric estimator for setting: reserve prices ...
Chen, S.L. and M.M. Tseng., A Negotiation-Credit-Auction Mechanism for Procuring ...
Padgham, Lin, and Michael Winikoff., Developing intelligent agent systems: A ...
Beam, C., and Segev, A., Automated negotiations: A survey of ...
Sutton, R.S., editor., Reinforcement Learnng . Kluwer Academic Press, Boston, ...
Chaharsooghi, S. K., J. Heydari, et al., A reinforcement learning ...
Li, X., Wang, J., & Sawhney, R., Reinforcement learning for ...
Iima, H., Kuroe, Y., Swarm Reinforcement Learning Algorithm Based on ...
Giannoccaro, I. and P. Pontrandolfo., Inventory management in supply chains: ...
Tang, H., Xu, L., Sun, J., Chen, Y., & Zhou, ...
Fu, J., & Fu, Y., An adaptive multi-agent system for ...
Mortazavi, A., Khamseh, A. A., & Azimi, P., Designing of ...
Russell,S and Peter Norvig., Artficial Intelligence: A Modern Approach . ...
Sutton, R.S., Barto, A.G., Reinforcement Learning . MIT Press, Cambridge,1998. ...
Watkins, C. J. C. H., Learning from delayed rewards (Doctoral ...
Tsitsiklis, J. N., Asynchronous stochastic approximation and Q-learning . Machine ...
Kennedy, J., Eberhart, R.C., Swarm Intelligence . Morgan Kaufmann Publishers, ...
Talbi,E., Metaheuristics: From Design to Implementation . ISBN: 978-0-470-27858-1, 2009. ...
Abdulhai, B., Pringle, R. and Karakoulas, G.J., Reinforcement learning for ...

نمایش کامل مراجع