ساخت توصیف به زبان فارسی برای تصاویر مجموعه داده Flickr8k

حسن, ملکی گلندوز; محسن, ابراهیمی مقدم

ساخت توصیف به زبان فارسی برای تصاویر مجموعه داده Flickr8k

عنوان مقاله: ساخت توصیف به زبان فارسی برای تصاویر مجموعه داده Flickr8k
شناسه ملی مقاله: ICMVIP10_023
منتشر شده در دهمین کنفرانس بینایی ماشین و پردازش تصویر ایران در سال 1396

مشخصات نویسندگان مقاله:

حسن ملکی گلندوز - دانشگاه شهید بهشتی تهران
محسن ابراهیمی مقدم - دانشگاه شهید بهشتی تهران

خلاصه مقاله:

ساخت توصیف تصویر بصورت خودکار، یکزمینه پژوهشی کلیدی در جامعه ی یادگیری ماشین است.با این حال بسیاری از پژوهش های اخیر روی ساخت توصیفانگلیسی انجام شده و زبان های دیگر مثل زبان فارسی،کمتر مورد توجه قرار گرفته است. در این مقاله، یک شبکهعصبی بازگشتی مالتی مودال (MRNN) برگرفته از [3]Karpathy and Fei-Fei, 2015 روی مجموعه داده Flickr8k باتوصیفات فارسی، آموزش داده شده است. مدل آموزش داده شده ی حاصل، با معیارهای CIDEr, BLEU score و Perplexity مورد ارزیابی قرار گرفته و با مدل انگلیسی ارایه شده در [ 3] و همچنین با ترجمه مدل [3] به فارسی، مقایسه شده است. مدل آموزش داده شده، بسیارنزدیک به مدل آموزش دیده توسط [3] روی توصیفاتانگلیسی است و همچنین از حالت ترجمه ای نیز بهتر عملمی کند. لذا میتوان نتیجه گرفت که مدل RNN بصورت عمومی خوب عمل می کند و یا حداقل برای سیستم هایتوصیف تصویر برای زبان های مختلف بطور مشابه کار می کند.

کلمات کلیدی:

بینایی ماشین، ساخت توصیف، شبکه های RNN، زبان فارسی، یادگیری عمیق

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/741440/