شبکه عصبی عمیق برای پیش‌بینی تعامل انسان در ویدئو با استفاده از روابط فازی و شار نوری

مه لقا افراسیابی; حسن ختن لو; محرم منصوری زاده

شبکه عصبی عمیق برای پیش‌بینی تعامل انسان در ویدئو با استفاده از روابط فازی و شار نوری

Publish place: Tabriz Journal of Electrical Engineering، Vol: 50، Issue: 3

Publish Year: 1399

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 12 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > شبکه عصبی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1124056

شناسه ملی سند علمی:

JR_TJEE-50-3_006

تاریخ نمایه سازی: 4 آذر 1399

Abstract:

پیش‌بینی تعامل در ویدئو یکی از موضوعات فعال در بینایی کامپیوتر است، که هدف آن پیش‌بینی تعامل قبل از انجام کامل آن است. این موضوع به دلیل چالش‌های موجود در این زمینه هنوز مورد توجه است. در این مقاله یک شبکه عصبی عمیق برای پیش‌بینی تعامل با استفاده از روابط فازی و شار نوری ارائه‌شده است. نوآوری این روش ایجاد دو تصویر فازی از یک ویدئو است. این تصاویر فازی بر مبنای گرادیان و شار نوری ایجاد می‌شود. توابع عضویت فازی مناسب برای روابط مکانی بین افراد در حال تعامل در تصاویر گرادیان و شار نوری ایجاد شده است. از طرفی یک تابع عضویت فاصله برای ارزش‌دهی به فریم‌ها و یک تابع عضویت فاصله برای ارزش‌دهی به ناحیه‌ی بین افراد در حال تعامل تعریف شده است. سپس ویژگی‌های مناسب مکانی-زمانی از این تصاویر با استفاده از معماری شبکه عصبی کانولوشن استخراج‌شده است. نتایج این روش بر روی دو مجموعه داده استاندارد تشخیص تعامل، BIT و UT ارزیابی شده است. نتایج نشان می‌دهد ایجاد تصاویر فازی و استخراج ویژگی‌های عمیق از آن تصاویر باعث افزایش دقت پیش‌بینی تعامل نسبت به روش‌های پیشین شده است.

Keywords:

رابطه مکانی فازی , گرادیان , شار نوری , شبکه کانولوشن

Authors

مه لقا افراسیابی

دانشکده فنی و مهندسی - دانشگاه بوعلی سینا

حسن ختن لو

دانشکده فنی و مهندسی - دانشگاه بوعلی سینا

محرم منصوری زاده

دانشکده فنی و مهندسی - دانشگاه بوعلی سینا

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

[1] M. S. Ryoo, “Human activity prediction: Early recognition of ...
[2] M. Ramanathan, W. Y. Yau and E. K. Teoh, ...
[3] N. G. Cho, S. H. Park, J. S. Park, ...
[4] امیر سزاوار، حسن فرسی، سجاد محمدزاده، »بازیابی تصویر مبتنی ...
[5] A. Krizhevsky, I. Sutskever and G.E. Hinton, “Imagenet classification ...
[6] G. Acampora, P. Foggia, A. Saggese and M. Vento, ...
[7] J. Y. Chang, J. J. Shyu, and C. W. ...
[8] H. Medjahed, D. Istrate, J. Boudy and B. Dorizzi, ...
[9] ندا خانبانی، امیرمسعود افتخاری مقدم، »ارائه یک روش تشخیص ...
[10] N. P. Trong, H. Nguyen, K. Kazunori and B. ...
[11] T. Lan, T. C. Chen, and S. Savarese, “A ...
[12] C. Gao, L. Yang, Y. Du, Z. Feng and ...
[13] Y. Kong, D. Kit, and Y. Fu, “A discriminative ...
[14] Y. Kong and Y. Fu, “Max-margin action prediction machine,” ...
[15] W. Choi, K. Shahid, and S. Savarese, “What are ...
[16] Z. Wang, S. Liu, J. Zhang, S. Chen, and ...
[17] J. M. Le Yaouanc and J.-P. Poli, “A fuzzy ...
[18] B. Yao, H. Hagras, M. J. Alhaddad and D. ...
[19] K. Mozafari, N. M. Charkari, H. S. Boroujeni and ...
[20] M. Raptis and L. Sigal, “Poselet key-framing: A model ...
[21] A. Iosifidis, A. Tefas, and I. Pitas, “Activity-based person ...
[22] L. Nanni, S. Ghidoni, and S. Brahnam, “Handcrafted vs. ...
[23] E. P. Ijjina and K. M. Chalavadi, “Human action ...
[24] H. J. Kim, J. S. Lee, and H. S. ...
[25] R. J. Moreno, O. A. Sanchez, and D. M. ...
[26] Q. Ke, M. Bennamoun, S. An, F. Boussaid, and ...
[27] Q. Ke, M. Bennamoun, S. An, F. Sohel and ...
[28] J. Donahue, L. Anne Hendricks , S. Guadarrama, M. ...
[29] A. Stergiou and R. Poppe, “Understanding human-human interactions: a ...
[30] X. Wang and J.M. Keller, “Human-based spatial relationship generalization ...
[31] R. Pierrard, J. P. Poli, and C. Hudelot, “Learning ...
[32] H. Hüttenrauch, K. S. Eklundh, A. Green and E. ...
[33] I. Bloch, “Fuzzy spatial relationships for image processing and ...
[34] A. Delmonte, I. Bloch, D. Hasboun, C. Mercier, J. ...
[35] J. J. Gibson, The perception of the visual world, ...
[36] T. Brox, A. Bruhn, N. Papenberg, and J. Weickert, ...
[37] S. Baker, D. Scharstein, J. P. Lewis, S. Roth, M. ...
[38] A. Ess, B. Leibe, K. Schindler and L. Van ...
[39] O. Russakovsky, J. Deng, H. Su, J. Krause, S. ...
[40] C. Li, Y. Hou, P. Wang, and W. Li, ...
[41] Y. Kong, Y. Jia, and Y. Fu., “Learning human ...
[42] M. S. Ryoo and J. Aggarwal., “UT-interaction dataset, ICPR ...
[43] Y. Jia, E. Shelhamer, J. Donahue, S. ...

نمایش کامل مراجع