ساخت توصیف به زبان فارسی برای تصاویر مجموعه داده Flickr8k

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: English
View: 717

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICMVIP10_023

تاریخ نمایه سازی: 2 تیر 1397

Abstract:

ساخت توصیف تصویر بصورت خودکار، یکزمینه پژوهشی کلیدی در جامعه ی یادگیری ماشین است.با این حال بسیاری از پژوهش های اخیر روی ساخت توصیفانگلیسی انجام شده و زبان های دیگر مثل زبان فارسی،کمتر مورد توجه قرار گرفته است. در این مقاله، یک شبکهعصبی بازگشتی مالتی مودال (MRNN) برگرفته از [3]Karpathy and Fei-Fei, 2015 روی مجموعه داده Flickr8k باتوصیفات فارسی، آموزش داده شده است. مدل آموزش داده شده ی حاصل، با معیارهای CIDEr, BLEU score و Perplexity مورد ارزیابی قرار گرفته و با مدل انگلیسی ارایه شده در [ 3] و همچنین با ترجمه مدل [3] به فارسی، مقایسه شده است. مدل آموزش داده شده، بسیارنزدیک به مدل آموزش دیده توسط [3] روی توصیفاتانگلیسی است و همچنین از حالت ترجمه ای نیز بهتر عملمی کند. لذا میتوان نتیجه گرفت که مدل RNN بصورت عمومی خوب عمل می کند و یا حداقل برای سیستم هایتوصیف تصویر برای زبان های مختلف بطور مشابه کار می کند.

Authors

حسن ملکی گلندوز

دانشگاه شهید بهشتی تهران

محسن ابراهیمی مقدم

دانشگاه شهید بهشتی تهران