ارائه ی یک معماری جدید از شبکه های باور عمیق برای شناسایی عمل در ویدئو

مجید, جودکی; حسین, ابراهیم پور کومله

ارائه ی یک معماری جدید از شبکه های باور عمیق برای شناسایی عمل در ویدئو

عنوان مقاله: ارائه ی یک معماری جدید از شبکه های باور عمیق برای شناسایی عمل در ویدئو
شناسه ملی مقاله: JR_JMVIP-11-1_003
منتشر شده در در سال 1403

مشخصات نویسندگان مقاله:

مجید جودکی - دانشجوی دکتری مهندسی کامپیوتر، دانشکده مهندسی برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران
حسین ابراهیم پور کومله - گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه کاشان، کاشان، ایران

خلاصه مقاله:

استفاده از یادگیری عمیق در حل مسایل مربوط به تحلیل داده های پیچیده و حجیم مانند ویدئوها گسترش یافته است. از جمله پردازش هایی که روی ویدیوها انجام می گیرد، تشخیص عمل های انسانی است که کاربردهای مهمی در حوزه نظارت خودکار، تعامل انسان با رایانه و بررسی رفتارهای سالمندان دارد. شبکه های باور عمیق از میان انواع مختلف شبکه های عمیق، به خاطر ویژگی های خاص خود، به ویژه توانایی همگرایی سریع نسبت به دیگر روش ها و ساختار یکسان لایه ها، مورد توجه قرار گرفته اند. لیکن، قدرت شبکه های باور عمیق پایه در پردازش داده های پیچیده که مبتنی بر زمان نیز هستند جای تامل دارد.در این مقاله، یک روش بازگشتی جدید بر مبنای شبکه های باور عمیق ارائه شده است. در روش پیشنهادی، توانایی پردازش و تفسیر فریم های دوبعدی ویدئو و درک مفهوم زمان به وسیله پیاده سازی بازگشتی به شبکه های باور عمیق اضافه شده است. این روش قادر به درک مفاهیم کوتاه مدت زمانی با استفاده از ماشین های بولتزمن محدود و بلند مدت زمانی بر مبنای پیاده سازی بازگشتی می باشد. روش پیشنهادی بر روی سه پایگاه داده شناخته شده در این حوزه با نام های KTH، UCF و HMDB۵۱ ارزیابی شده و به ترتیب به دقت های برابر با ۹۵.۰۲، ۹۳.۱۴ و ۷۴.۲۸ دست یافته و با سایر روش های محبوب در شرایط مختلف مقایسه گردیده است.

کلمات کلیدی:

یادگیری عمیق, شبکه های باور عمیق, ماشین های بولتزمن محدود, شناسایی عمل, شبکه های عصبی بازگشتی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/2055651/