ارایه مدلی مبتنی بر یادگیری عمیق برای پرسش و پاسخ بصری پزشکی

Publish Year: 1400
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 740

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CONFSKU01_034

تاریخ نمایه سازی: 17 آبان 1400

Abstract:

یکی از شاخه های هوش مصنوعی چندبعدی، سیستم های پرسش و پاسخ بصری ((Visual Question Answering (VQA) است. در واقع روش VQA یک پژوهش میان رشته ای است که نیاز به دانش کافی در بینایی رایانه و پردازش زبان طبیعی دارد و به عنوان یکی از معیارهای اصلی اندازه گیری برای هوش ماشین در نظر گرفته می شود که در سالهای اخیر علاوه بر حوزهی عمومی در حوزه های پزشکی نیز به شدت مورد توجه قرار گرفته است. به طوری که این روش هم برای پزشک و هم برای بیمار مفید واقع می شود؛ زیرا می تواند به پزشکان در تصمیم گیری بهتر کمک کند و بیماران را در رسیدن به پاسخ پرسش های خود در مورد تصاویر پزشکی که بیانگر وضع سلامتی آنها است، یاری رساند. در این پژوهش با انتخاب مجموعه داده ای که شامل تصاویر رادیولوژی به همراه پرسش و پاسخ مربوط به هر تصویر می باشد، و با استفاده از الگوریتمهای یادگیری عمیقGRU ,CNN و تعبیه ساز کلمه و ساز و کار توجه)Attention Mechanism( مدلی با هدف افزایش دقت در پاسخگویی به پرسش های مربوط به تصاویر رادیولوژی ارائه شده است. در نتایج بدست آمده از روش پیشنهادی شاهد بهبود کارایی نسبت به روش های مشابه که بر روی این مجموعه داده ارائه شده است، هستیم. همچنین مدل ارائه شده نسبت به مدلی که از الگوریتم یادگیری ماشین معمول بهره می برد و یا از مدلی که از ساز و کار توجه به شکل متفاوت استفاده کرده است، عملکردی بهتر را دارا میباشد

Keywords:

Authors

هادی علی خانی فرادنبه

دانشجوی کارشناسی ارشد مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهرکرد

شهلا نعمتی

استادیار گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهرکرد

محمداحسان بصیری

استادیار گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه شهرکرد