یادگیری عمیق ویژگی های مکانی-زمانی برای بازشناسی کنش های انسانی در ویدیو

رضا صفدری; محمدشهرام معین

یادگیری عمیق ویژگی های مکانی-زمانی برای بازشناسی کنش های انسانی در ویدیو

Publish place: 2nd International Conference on Computer Engineering and Information Technology

Publish Year: 1396

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 21 Page And PDF and WORD Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > یادگیری عمیق

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/696366

شناسه ملی سند علمی:

CITCOMP02_426

تاریخ نمایه سازی: 7 اسفند 1396

Abstract:

در این مقاله برای یادگیری ویژگی های مکانی-زمانی و به منظور بازشناسی کنش های انسانی از روی توالی های ویدیویی، یک مدل سلسله مراتبی و عمیق بدون ناظر پیشنهاد شده است. در بلوک سازنده این مدل سلسله مراتبی، دو معیار تنک بودن و کند بودن ، به عنوان تنظیم کننده در یک تابع هدف با یکدیگر ترکیب شده اند. همچنین محدودیت متعامدسازی نرمال نیز با شرط بازساخت جایگزین شده است که این جایگزینی امکان یادگیری بازنمایش های بیشتر از کامل و همچنین سریعتر شدن فرآیند بهینه سازی، به خصوص در مورد داده های با ابعاد بالا مانند توالی های ویدیویی را فراهم می آورد. سپس برای یادگیری ویژگی های سطح بالا، این بلوک سازنده را با تکنیکهای یادگیری عمیق، کانولوشن و پشته ای قرار دادن لایه ها ترکیب می کنیم. بکارگیری این مدل برای استخراج ویژگی های مکانی-زمانی منجر به دقت 5/94 % بر روی پایگاه داده KTH و میانگین متوسط صحت ، 8/54 % بر روی پایگاه داده Hollywood2 شده است که بهبود کارایی آن نسبت به معیار تنک بودن، به ترتیب 3% و 5/1 % و نسبت به معیار کند بودن، به ترتیب حدود 3/1 % و 6% است

Keywords:

بازشناسی کنش های انسانی , پردازش ویدیو , یادگیری عمیق بازنمایش ها , تنک بودن , کند بودن

Authors

رضا صفدری

دانشگاه آزاد اسلامی، واحد قزوین، دانشکده مهندسی کامپیوتر و فناوری اطلاعات، قزوین، ایران

محمدشهرام معین

پژوهشگاه ارتباطات و فناوری اطلاعات، پژوهشکده فناوری اطلاعات، تهران، ایران