شبکه عصبی عمیق برای پیش‌بینی تعامل انسان در ویدئو با استفاده از روابط فازی و شار نوری

Publish Year: 1399
نوع سند: مقاله ژورنالی
زبان: Persian
View: 311

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_TJEE-50-3_006

تاریخ نمایه سازی: 4 آذر 1399

Abstract:

 پیش‌بینی تعامل در ویدئو یکی از موضوعات فعال در بینایی کامپیوتر است، که هدف آن پیش‌بینی تعامل قبل از انجام کامل آن است. این موضوع به دلیل چالش‌های موجود در این زمینه هنوز مورد توجه است. در این مقاله یک شبکه عصبی عمیق برای پیش‌بینی تعامل با استفاده از روابط فازی و شار نوری ارائه‌شده است. نوآوری این روش ایجاد دو تصویر فازی از یک ویدئو است. این تصاویر فازی بر مبنای گرادیان و شار نوری ایجاد می‌شود. توابع عضویت فازی مناسب برای روابط مکانی بین افراد در حال تعامل در تصاویر گرادیان و شار نوری ایجاد شده است. از طرفی یک تابع عضویت فاصله برای ارزش‌دهی به فریم‌ها و یک تابع عضویت فاصله برای ارزش‌دهی به ناحیه‌ی بین افراد در حال تعامل تعریف شده است. سپس ویژگی‌های مناسب مکانی-زمانی از این تصاویر با استفاده از معماری شبکه عصبی کانولوشن استخراج‌شده است. نتایج این روش بر روی دو مجموعه داده استاندارد تشخیص تعامل، BIT و UT ارزیابی شده است. نتایج نشان می‌دهد ایجاد تصاویر فازی و استخراج ویژگی‌های عمیق از آن تصاویر باعث افزایش دقت پیش‌بینی تعامل نسبت به روش‌های پیشین شده است.

Authors

مه لقا افراسیابی

دانشکده فنی و مهندسی - دانشگاه بوعلی سینا

حسن ختن لو

دانشکده فنی و مهندسی - دانشگاه بوعلی سینا

محرم منصوری زاده

دانشکده فنی و مهندسی - دانشگاه بوعلی سینا

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • [1]      M. S. Ryoo, “Human activity prediction: Early recognition of ...
  • [2]      M. Ramanathan, W. Y. Yau and E. K. Teoh, ...
  • [3]      N. G. Cho, S. H. Park, J. S. Park, ...
  • [4]      امیر سزاوار، حسن فرسی، سجاد محمدزاده، »بازیابی تصویر مبتنی ...
  • [5]      A. Krizhevsky, I. Sutskever and G.E. Hinton, “Imagenet classification ...
  • [6]      G. Acampora, P. Foggia, A. Saggese and M. Vento, ...
  • [7]      J. Y. Chang, J. J. Shyu, and C. W. ...
  • [8]      H. Medjahed, D. Istrate, J. Boudy and B. Dorizzi, ...
  • [9]      ندا خانبانی، امیرمسعود افتخاری مقدم، »ارائه یک روش تشخیص ...
  • [10]      N. P. Trong, H. Nguyen, K. Kazunori and B. ...
  • [11]      T. Lan, T. C. Chen, and S. Savarese, “A ...
  • [12]      C. Gao, L. Yang, Y. Du, Z. Feng and ...
  • [13]      Y. Kong, D. Kit, and Y. Fu, “A discriminative ...
  • [14]      Y. Kong and Y. Fu, “Max-margin action prediction machine,” ...
  • [15]      W. Choi, K. Shahid, and S. Savarese, “What are ...
  • [16]      Z. Wang, S. Liu, J. Zhang, S. Chen, and ...
  • [17]      J. M. Le Yaouanc and J.-P. Poli, “A fuzzy ...
  • [18]      B. Yao, H. Hagras, M. J. Alhaddad and D. ...
  • [19]      K. Mozafari, N. M. Charkari, H. S. Boroujeni and ...
  • [20]      M. Raptis and L. Sigal, “Poselet key-framing: A model ...
  • [21]      A. Iosifidis, A. Tefas, and I. Pitas, “Activity-based person ...
  • [22]      L. Nanni, S. Ghidoni, and S. Brahnam, “Handcrafted vs. ...
  • [23]      E. P. Ijjina and K. M. Chalavadi, “Human action ...
  • [24]      H. J. Kim, J. S. Lee, and H. S. ...
  • [25]      R. J. Moreno, O. A. Sanchez, and D. M. ...
  • [26]      Q. Ke, M. Bennamoun, S. An, F. Boussaid, and ...
  • [27]      Q. Ke, M. Bennamoun, S. An, F. Sohel and ...
  • [28]      J. Donahue, L. Anne Hendricks , S. Guadarrama, M. ...
  • [29]      A. Stergiou and R. Poppe, “Understanding human-human interactions: a ...
  • [30]      X. Wang and J.M. Keller, “Human-based spatial relationship generalization ...
  • [31]      R. Pierrard, J. P. Poli, and C. Hudelot, “Learning ...
  • [32]      H. Hüttenrauch, K. S. Eklundh, A. Green and E. ...
  • [33]      I. Bloch, “Fuzzy spatial relationships for image processing and ...
  • [34]      A. Delmonte, I. Bloch, D. Hasboun, C. Mercier, J. ...
  • [35]      J. J. Gibson, The perception of the visual world, ...
  • [36]      T. Brox, A. Bruhn, N. Papenberg, and J. Weickert, ...
  • [37]      S. Baker, D. Scharstein, J. P. Lewis, S. Roth, M. ...
  • [38]      A. Ess, B. Leibe, K. Schindler and L. Van ...
  • [39]      O. Russakovsky, J. Deng, H. Su, J. Krause, S. ...
  • [40]      C. Li, Y. Hou, P. Wang, and W. Li, ...
  • [41]      Y. Kong, Y. Jia, and Y. Fu., “Learning human ...
  • [42]      M. S. Ryoo and J. Aggarwal., “UT-interaction dataset, ICPR ...
  • [43]      Y. Jia, E. Shelhamer, J. Donahue, S. ...
  • نمایش کامل مراجع