ارائه ی یک معماری جدید از شبکه های باور عمیق برای شناسایی عمل در ویدئو

Publish Year: 1403
نوع سند: مقاله ژورنالی
زبان: Persian
View: 31

This Paper With 16 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JMVIP-11-1_003

تاریخ نمایه سازی: 27 مرداد 1403

Abstract:

استفاده از یادگیری عمیق در حل مسایل مربوط به تحلیل داده های پیچیده و حجیم مانند ویدئوها گسترش یافته است. از جمله پردازش هایی که روی ویدیوها انجام می گیرد، تشخیص عمل های انسانی است که کاربردهای مهمی در حوزه نظارت خودکار، تعامل انسان با رایانه و بررسی رفتارهای سالمندان دارد. شبکه های باور عمیق از میان انواع مختلف شبکه های عمیق، به خاطر ویژگی های خاص خود، به ویژه توانایی همگرایی سریع نسبت به دیگر روش ها و ساختار یکسان لایه ها، مورد توجه قرار گرفته اند. لیکن، قدرت شبکه های باور عمیق پایه در پردازش داده های پیچیده که مبتنی بر زمان نیز هستند جای تامل دارد.در این مقاله، یک روش بازگشتی جدید بر مبنای شبکه های باور عمیق ارائه شده است. در روش پیشنهادی، توانایی پردازش و تفسیر فریم های دوبعدی ویدئو و درک مفهوم زمان به وسیله پیاده سازی بازگشتی به شبکه های باور عمیق اضافه شده است. این روش قادر به درک مفاهیم کوتاه مدت زمانی با استفاده از ماشین های بولتزمن محدود و بلند مدت زمانی بر مبنای پیاده سازی بازگشتی می باشد. روش پیشنهادی بر روی سه پایگاه داده شناخته شده در این حوزه با نام های KTH، UCF و HMDB۵۱ ارزیابی شده و به ترتیب به دقت های برابر با ۹۵.۰۲، ۹۳.۱۴ و ۷۴.۲۸ دست یافته و با سایر روش های محبوب در شرایط مختلف مقایسه گردیده است.

Keywords:

یادگیری عمیق , شبکه های باور عمیق , ماشین های بولتزمن محدود , شناسایی عمل , شبکه های عصبی بازگشتی

Authors

مجید جودکی

دانشجوی دکتری مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران

حسین ابراهیم پور کومله

گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران