ساختار معلم و دانش آموز برای تشخیص فعالیت انسان در تصاویر ثابت بر مبنای یادگیری عمیق

معصومه چاپاری نیا; شهریار برادران شکوهی

ساختار معلم و دانش آموز برای تشخیص فعالیت انسان در تصاویر ثابت بر مبنای یادگیری عمیق

Publish place: 4th International Congress of Electrical, Computer and Mechanical Engineering

Publish Year: 1399

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 12 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1039254

شناسه ملی سند علمی:

ISCELEC04_018

تاریخ نمایه سازی: 27 مرداد 1399

Abstract:

اخیر ا شبکه های عصبی کانولوشنی پیشرفت زیادی در طبقه بندی تصاویر داشته اند. اما تشخیص فعالیتانسان در تصاویر ثابت همچنان چالش برانگیز است، زیرا برخلاف ویدئوها، دارای نشانه های حرکتی نیستند. در حال حاضر بیشتر رویکردهای مبتنی بر CNN برای تشخیص فعالیت انسان در تصاویر ثابت دارای هزینه ها و زمان محاسباتی بیش از حد با تعداد بیشماری پارامتر هستند. روش های کارآمد اخیر مستقیما یک شبکه یعمیق با تعداد لایه های زیاد را با استفاده از داده های کمکی مانند جعبه های محدود کننده ی انسان، جعبه هایمحدود کننده ی اشیاء، جعبه های محدود کننده ی بخش های بدن انسان و غیره بر روی مجموعه ی داده یفعالیت انسان در تصاویر ثابت آموزش می دهند. با این حال این روش ها علاوه بر هزینه های لازم جهت ایجادداده های کمکی از تصاویر، دارای تعداد زیادی پارامتر هستند و بنابراین برای کاربردهای دنیای واقعی هماننددستگاه های تلفن همراه و سایر دستگاه هایی که دارای منابع محاسباتی محدود هستند، مناسب نیستند. ماساختار معلم و دانش آموز را برای تشخیص فعالیت انسان در تصاویر ثابت به کار می بریم که می تواند عملکردشبکه دانش آموز را برای تشخیص فعالیت انسان بدون افزایش پارامتر و هزینه های محاسباتی بهبود بخشد.علاوه بر این، برای جلوگیری از بیش برازش شبکه ها به دلیل کمبود داده های آموزشی برچسب خورده، روشانتقال یادگیری، یعنی استفاده از شبکه های کانولوشنی از پیش آموزش داده شده روی مجموعه داده ی ImageNet، به کار برده می شود. ما چهار ساختار معلم و دانش آموز متفاوت را روی مجموعه ی داده ی Stanford 40 بررسی خواهیم کرد. از بین این چهار ساختار، ساختار معلم و دانش آموز شبکه های Se-Resnext؛ 50 لایه و شبکه ی Se-Resnext؛ 101 لایه عملکرد بهتری روی مجموعه ی داده ی Stanford 40 داشت و به میانگین دقت متوسط 91/84% دست یافت. مقایسه ی نتایج ما با کارهای دیگر نشان می دهد که ما توانسته ایم میانگین دقت متوسط شناسایی فعالیت انسان در تصاویر ثابت را بدون افزایش تعداد پارامترها و پیچیدگی شبکه ی پایه، بهبود ببخشیم.

Keywords:

بینایی ماشین , یادگیری عمیق , تشخیص نوع فعالیت انسان , فشرده سازی دانش , ساختار معلم و دانش آموز

Authors

معصومه چاپاری نیا

دانشجوی کارشناسی ارشد مهندسی برق، دانشگاه علم وصنعت ایران، تهران

شهریار برادران شکوهی

دانشیار مهندسی برق، دانشگاه علم وصنعت ایران، تهران