بهبود شبکه عمیق R-FCN در آشکارسازی و برچسب‎زنی اشیاء

Publish Year: 1398
نوع سند: مقاله ژورنالی
زبان: Persian
View: 326

This Paper With 17 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JMVIP-6-2_004

تاریخ نمایه سازی: 23 اردیبهشت 1400

Abstract:

امروزه آشکارسازی و برچسب‎زنی اشیاء در تصاویر یکی از چالش‎های اساسی در برخی از کاربردهای بینایی‎ماشین می‎باشد. در سال‎های اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکه‎های عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می شود. در ادامه شبکه‎ای بهبود یافته از شبکه R-FCN ارائه می‎شود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسب‎زنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری ۱۰۱-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسب‎زنی ۳۶ شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد ۴۸/۳۸% و مدت زمان متوسط برای هر تصویر ۰/۱۳ را دارد، و نسبت به بهترین روش در این حوزه تقریبا ۲% در عملکرد و ۰/۴ ثانیه در زمان بهتر عمل کرده است.

Keywords:

آشکارسازی و شناسایی اشیاء , یادگیری عمیق , R-FCN , ماشین بردار پشتیبان دودویی فازی , اختلاف کوشی-شوارتز

Authors

علی قنبری سرخی

دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

حمید حسن پور

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود

منصور فاتح

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود