CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

پالایش شرح گذاری مجموعه تصاویر با مقیاس بزرگ با یادگیری انتقالی در شبکه عصبی کانولوشنال عمیق

عنوان مقاله: پالایش شرح گذاری مجموعه تصاویر با مقیاس بزرگ با یادگیری انتقالی در شبکه عصبی کانولوشنال عمیق
شناسه ملی مقاله: JR_JMVIP-5-1_004
منتشر شده در در سال 1397
مشخصات نویسندگان مقاله:

شیما جوانمردی - دانشجوی دکتری مهندسی کامپیوتر گرایش هوش مصنوعی، دانشکده برق و کامپیوتر، دانشگاه یزد
محمد علی زارع چاهوکی - دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد

خلاصه مقاله:
فرآیند پالایش شرح ­گذاری تصاویر، رویکردی موثر در بهبود بازیابی تصاویر مبتنی بر برچسب می باشد. در شبکه ­های اجتماعی و موتورهای جستجو بسیاری از تصاویر دارای تگ ­های مبهم، ناقص و بی­ ارتباط با محتوا هستند. وجود این تگ ­های غیرقابل اعتماد، موجب کاهش دقت بازیابی تصاویر می ­شود. از این­رو در دهه اخیر، الگوریتم ­هایی با عنوان پالایش تگ (TR) مطرح شده اند که به رفع نویز و غنی سازی برچسب های تصاویر می پردازند. به ­منظور دستیابی به نتایج بهینه در TR، استخراج ویژگی­ هایی از تصویر که توصیف مناسبی از محتوای دیداری تصویر داشته باشند، تاثیر مستقیمی بر دقت فرآیند TR دارد. از جمله چالش ­های عمده در فرآیند پالایش شرح ­گذاری تصاویر، رسیدن به توصیفی مناسب و مرتبط با محتوای تصاویر می­باشد. بدین منظور با توجه به کارآمدی فرآیند یادگیری عمیق در بسیاری از حوزه ­های پژوهشی، در این مقاله نیز به منظور استخراج ویژگی­ های کارآمد در تشابه دیداری تصاویر و ارتباط معنایی تصاویر با هم، از شبکه ­های عصبی کانولوشنال عمیق (DCNN) استفاده شده ­است. بهره ­گیری از فرآیند یادگیری انتقالی استفاده شده در DCNN مبتنی بر تصاویر ImageNet در توصیف و ایجاد ارتباط معنایی در مجموعه تصاویر با مقیاس بزرگ NUS-WIDE، بیانگر موثر بودن این رویکرد در کاربرد پالایش تگ تصاویر است.

کلمات کلیدی:
پالایش شرح گذاری تصاویر, شبکه عصبی کانولوشنال عمیق, پالایش تگ, بازیابی تصاویر, یادگیری انتقالی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1206102/