ساخت توصیف به زبان فارسی برای تصاویر مجموعه داده Flickr8k
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: English
View: 717
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICMVIP10_023
تاریخ نمایه سازی: 2 تیر 1397
Abstract:
ساخت توصیف تصویر بصورت خودکار، یکزمینه پژوهشی کلیدی در جامعه ی یادگیری ماشین است.با این حال بسیاری از پژوهش های اخیر روی ساخت توصیفانگلیسی انجام شده و زبان های دیگر مثل زبان فارسی،کمتر مورد توجه قرار گرفته است. در این مقاله، یک شبکهعصبی بازگشتی مالتی مودال (MRNN) برگرفته از [3]Karpathy and Fei-Fei, 2015 روی مجموعه داده Flickr8k باتوصیفات فارسی، آموزش داده شده است. مدل آموزش داده شده ی حاصل، با معیارهای CIDEr, BLEU score و Perplexity مورد ارزیابی قرار گرفته و با مدل انگلیسی ارایه شده در [ 3] و همچنین با ترجمه مدل [3] به فارسی، مقایسه شده است. مدل آموزش داده شده، بسیارنزدیک به مدل آموزش دیده توسط [3] روی توصیفاتانگلیسی است و همچنین از حالت ترجمه ای نیز بهتر عملمی کند. لذا میتوان نتیجه گرفت که مدل RNN بصورت عمومی خوب عمل می کند و یا حداقل برای سیستم هایتوصیف تصویر برای زبان های مختلف بطور مشابه کار می کند.
Keywords:
Authors
حسن ملکی گلندوز
دانشگاه شهید بهشتی تهران
محسن ابراهیمی مقدم
دانشگاه شهید بهشتی تهران