بهبود شبکه عمیق R-FCN در آشکارسازی و برچسبزنی اشیاء
Publish place: Machine Vision and Image Processing، Vol: 6، Issue: 2
Publish Year: 1398
نوع سند: مقاله ژورنالی
زبان: Persian
View: 326
This Paper With 17 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_JMVIP-6-2_004
تاریخ نمایه سازی: 23 اردیبهشت 1400
Abstract:
امروزه آشکارسازی و برچسبزنی اشیاء در تصاویر یکی از چالشهای اساسی در برخی از کاربردهای بیناییماشین میباشد. در سالهای اخیر استفاده از یادگیری عمیق مورد توجه محققان قرار گرفته است. در همین راستا، در این مقاله ابتدا جدیدترین شبکههای عمیق موجود معرفی، سپس نقاط قوت و ضعف آنها تحلیل می شود. در ادامه شبکهای بهبود یافته از شبکه R-FCN ارائه میشود. روش پیشنهادی بر پایه معماری ResNet و شبکه تمام کانولوشن است. در این روش، معماری جدیدی مبتنی بر شبکه عمیق برای پیشنهاد ناحیه کاندید و روشی ترکیبی مبتنی بر SVMفازی دوکلاسه و SVR برای آشکارسازی و برچسبزنی اشیاء ارائه شده است. در این روش از تابع زیان جدید با عنوان اختلاف کوشی-شوارتز استفاده شده است. این تابع زیان از لحاظ سرعت و دقت، عملکرد بهتری از خود نشان داده است. روش پیشنهادی با معماری ۱۰۱-ResNet بر روی مجموعه داده SUN برای آشکارسازی و برچسبزنی ۳۶ شی مورد آزمایش قرار گرفت و نتایج بدست آمده نشان دهنده بهبود عملکرد این روش نسبت به روش پایه شبکه R-FCN است. روش پیشنهادی از لحاظ معیار mAP، عملکرد ۴۸/۳۸% و مدت زمان متوسط برای هر تصویر ۰/۱۳ را دارد، و نسبت به بهترین روش در این حوزه تقریبا ۲% در عملکرد و ۰/۴ ثانیه در زمان بهتر عمل کرده است.
Keywords:
آشکارسازی و شناسایی اشیاء , یادگیری عمیق , R-FCN , ماشین بردار پشتیبان دودویی فازی , اختلاف کوشی-شوارتز
Authors
علی قنبری سرخی
دانشجوی دکتری مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
حمید حسن پور
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود
منصور فاتح
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود