استفاده از ساختارهای هرمی و شبکه های کاملا کانولوشنی در قطعه بندی معنایی تصاویر

حسن, علی کرمی; محمدجواد, فدایی اسلام; فرزین, یغمایی

استفاده از ساختارهای هرمی و شبکه های کاملا کانولوشنی در قطعه بندی معنایی تصاویر

عنوان مقاله: استفاده از ساختارهای هرمی و شبکه های کاملا کانولوشنی در قطعه بندی معنایی تصاویر
شناسه ملی مقاله: ICMVIP11_027
منتشر شده در یازدهمین کنفرانس ملی و اولین کنفرانس بین‌المللی بینایی ماشین و پردازش تصویر ایران در سال 1398

مشخصات نویسندگان مقاله:

حسن علی کرمی - دانشجوی دکتری مهندسی کامپیوتر – هوش مصنوعی ، دانشکده مهندس ی برق و کامپیوتر ، دانشگاه سمنان، سمنان، ایران
محمدجواد فدایی اسلام - استا دیار ، دانشکده مهندسی برق و کامپیوتر ، دانشگاه سمنان، سمنان، ایران
فرزین یغمایی - دانشیار ، دانشکده مهندسی برق و کامپیوتر ، دانشگاه سمنان، سمنان، ایران

خلاصه مقاله:

فهم یک تصویر و درک محتوا از مهم ترین چالش های پیشرو در یادگیری و بینایی ماشین است. یکی از مهم ترین راه های بررسی این چالش از مسیر قطعه بندی معنایی خواهد بود. در این مقاله، با ارائه یک رویکرد کاملا کانولوشنی و استفاده از معماری های کانولوشن و کانولوشن معکوس به همراه ساختارهای هرمی آتروس، به بررسی قطعه بندی معنایی پرداخته شده است. در این روش از معماری اولیه ResNet101 در قسمت استخراج ویژگی جهت استخراج ویژگی از تصاویر، و سپس از ساختارهای هرمی آتروس در مرکز اتصالات شبکه کانولوشن و کانولوشن معکوس استفاده شده است تا اطلاعات محلی و عمومی در قسمت ویژگی ها ترکیب گردد. از طرفی لایه های استخراج ویژگی با افزایش ابعاد در سطوح مختلف، به لایه های کانولوشن معکوس انتقال داده شده است. نتایج حاصل از این روش، دقت88/1 درصدی و برتری قطعه بندی معنایی نسبت به رویکردهای مورد بررسی را نشان می دهد

کلمات کلیدی:

قطعه بندی معنایی، کانولوشن، کانولوشن معکوس، ساختار هرمی آتروس، . ResNet101

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1045166/