پالایش شرح گذاری مجموعه تصاویر با مقیاس بزرگ با یادگیری انتقالی در شبکه عصبی کانولوشنال عمیق

Publish Year: 1397
نوع سند: مقاله ژورنالی
زبان: Persian
View: 216

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JMVIP-5-1_004

تاریخ نمایه سازی: 23 اردیبهشت 1400

Abstract:

فرآیند پالایش شرح ­گذاری تصاویر، رویکردی موثر در بهبود بازیابی تصاویر مبتنی بر برچسب می باشد. در شبکه ­های اجتماعی و موتورهای جستجو بسیاری از تصاویر دارای تگ ­های مبهم، ناقص و بی­ ارتباط با محتوا هستند. وجود این تگ ­های غیرقابل اعتماد، موجب کاهش دقت بازیابی تصاویر می ­شود. از این­رو در دهه اخیر، الگوریتم ­هایی با عنوان پالایش تگ (TR) مطرح شده اند که به رفع نویز و غنی سازی برچسب های تصاویر می پردازند. به ­منظور دستیابی به نتایج بهینه در TR، استخراج ویژگی­ هایی از تصویر که توصیف مناسبی از محتوای دیداری تصویر داشته باشند، تاثیر مستقیمی بر دقت فرآیند TR دارد. از جمله چالش ­های عمده در فرآیند پالایش شرح ­گذاری تصاویر، رسیدن به توصیفی مناسب و مرتبط با محتوای تصاویر می­باشد. بدین منظور با توجه به کارآمدی فرآیند یادگیری عمیق در بسیاری از حوزه ­های پژوهشی، در این مقاله نیز به منظور استخراج ویژگی­ های کارآمد در تشابه دیداری تصاویر و ارتباط معنایی تصاویر با هم، از شبکه ­های عصبی کانولوشنال عمیق (DCNN) استفاده شده ­است. بهره ­گیری از فرآیند یادگیری انتقالی استفاده شده در DCNN مبتنی بر تصاویر ImageNet در توصیف و ایجاد ارتباط معنایی در مجموعه تصاویر با مقیاس بزرگ NUS-WIDE، بیانگر موثر بودن این رویکرد در کاربرد پالایش تگ تصاویر است.

Keywords:

پالایش شرح گذاری تصاویر , شبکه عصبی کانولوشنال عمیق , پالایش تگ , بازیابی تصاویر , یادگیری انتقالی

Authors

شیما جوانمردی

دانشجوی دکتری مهندسی کامپیوتر گرایش هوش مصنوعی، دانشکده برق و کامپیوتر، دانشگاه یزد

محمد علی زارع چاهوکی

دانشکده مهندسی برق و کامپیوتر، دانشگاه یزد