یادگیری دیکشنری جهت بازشناسی کنش انسان در ویدئو
Publish place: Sixth National Congress on Electrical Engineering and Computer Engineering of Iran with a New Approach to New Energy
Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 396
This Paper With 14 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF06_093
تاریخ نمایه سازی: 24 شهریور 1398
Abstract:
بازشناسی کنش انسان به دلیل پیچیدگی حرکات و شباهت زیاد بین مشخصه های مختلف در حرکات یکی از کارهای بسیار پیچیده و مشکل می باشد، یکی از روش های مورد استفاده در این حوزه بازنمایی تنک است. این مقاله به تاثیر بازنمایی تنک با دیکشنری در زمینه تشخیص کنش در ویدئو پرداخته و به منظور مدل سازی یک چارچوب یادگیری پیشنهاد شده است. دیکشنری کامل با استفاده از مجموعه توصیفگرهای مکانی_زمانی (استخراج شده از دنباله های ویدیوئی) ساخته شده، بطوری که هر توصیفگر با تعدادی ترکیب خطی از تعداد کمی از عناصر دیکشنری نشان داده شده است. این روش منجر به نمایش کامل تر و قوی تری از دنباله های ویدیویی نسبت به روش هایی مثل خوشه بندی و وکوانتیزیشن برداری می شود. ما روش LC-KSVD را پیشنهاد کردیم، هدف این روش استفاده از اطلاعات لیبل دار سیگنال های ورودی برای یادگیری دیکشنری سازگار و متمایز دهنده است. روش ما بر روی دادگان استاندارد امتحان شده و آزمایشات نشان می دهد که نتایج این روش از روش های قبل بهینه تر، دقت آن بالاتر و خطای کمتری نیز دارد.
Keywords:
Authors
آرزو یدالهی
دانشجوی کارشناسی ارشد مهندسی کامپیوتر،موسسه آموزش عالی روزبهان،ساری،ایران
ابوالفضل لاکدشتی
استادیار گروه کامپیوتر دانشگاه موسسه آموزش عالی روزبهان،ساری،ایران
سجاد توسلی
مربی گروه کامپیوتر دانشگاه موسسه آموزش عالی روزبهان،ساری،ایران