استفاده از یادگیری عمیق بازنمایشها برای بازشناسی کنشهای انسانی در ویدیو

رضا صفدری; محمدشهرام معین

استفاده از یادگیری عمیق بازنمایشها برای بازشناسی کنشهای انسانی در ویدیو

Publish place: The 7Conference of Al Robotics and the 9th RoboCup Iranopen International Symposium 2018

Publish Year: 1396

Type: Conference paper

Language: Persian

This Paper With 7 Page And PDF Format Ready To Download

DOWNLOAD Paper

Certificate
I'm the author of the paper

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری عمیق

Export:

Link to this Paper:

https://civilica.com/doc/714384

Document National Code:

IRANOPEN07_009

Index date: 18 April 2018

استفاده از یادگیری عمیق بازنمایشها برای بازشناسی کنشهای انسانی در ویدیو abstract

در این مقاله برای یادگیری ویژگی های مکانی-زمانی و به منظور بازشناسی کنش های انسانی از روی توالی های ویدیویی، یک مدل سلسله مراتبی و عمیق بدون ناظر پیشنهاد شده است. در بلوک سازنده این مدل سلسله مراتبی، دو معیار تنک بودن و کند بودن، به عنوان تنظیم کننده در یک تابع هدف با یکدیگر ترکیب شده اند. سپس برای یادگیری ویژگی های سطح بالا، این بلوک سازنده را با تکنیک های یادگیری عمیق، کانولوشن و پشته ای قرار دادن لایه ها ترکیب کرده ایم. بکارگیری این مدل برای استخراج ویژگی های مکانی-زمانی منجر به دقت 94/5 ٪ بر روی پایگاه داده KTH و میانگین متوسط صحت، 54/8 ٪ بر روی پایگاه داده Hollywood2 شده است که بهبود کارایی آن نسبت به معیار تنک بودن، به ترتیب 3٪ و 1/5 ٪ و نسبت به معیار کند بودن، به ترتیب حدود 1/3 ٪ و 6٪ است.

استفاده از یادگیری عمیق بازنمایشها برای بازشناسی کنشهای انسانی در ویدیو Keywords:

بازشناسی کنش های انسانی , پردازش ویدیو , یادگیری عمیق بازنمایش ها , تنک بودن , کند بودن

استفاده از یادگیری عمیق بازنمایشها برای بازشناسی کنشهای انسانی در ویدیو authors

رضا صفدری

دانشگاه آزاد اسلامی، واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، قزوین، ایران

محمدشهرام معین

پژوهشگاه ارتباطات و فناوری اطلاعات، پژوهشکده فناوری اطلاعات، تهران، ایران