تصحیح غلط های املایی گزارش ها رادیولوژی به زبان فارسی به کمک پردازش زبان طبیعی

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,388

نسخه کامل این Paper ارائه نشده است و در دسترس نمی باشد

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

THPC02_073

تاریخ نمایه سازی: 24 مهر 1398

Abstract:

مقدمه: ازآنجایی که گزارش ها بالینی تحت محدودیت زمانی نگارش می شوند، دارای غلط های املایی هستند. علی رغم وجود سامانه های تصحیح غلط های املایی برای زبان فارسی، این گونه سامانه ها به صورت عمومی در حال استفاده هستند و در حوزه پزشکی سیستم تصحیح گر غلط املایی موجود نیست؛ بنابراین در این مطالعه، یک سیستم تشخیص و تصحیح خودکار غلط های املایی Non-Word موجود در گزارش ها رادیولوژی و سونوگرافی به زبان فارسی توسعه داده شده است.روش کار: این پژوهش یک پژوهش توسعه ای-کاربردی است که طی سال های 96-97 در مرکز تحقیقات سرطان بیمارستان امام خمینی (ره) تهران انجام شد. از سه منبع داده (گزارش ها سونوگرافی پستان (871275 کلمه)، سونوگرافی سر و گردن (168055 کلمه) و سونوگرافی شکم و لگن (56084 کلمه)) که از سیستم اطلاعات بیمارستانی (HIS) بیمارستان امام خمینی (ره) استخراج شدند، استفاده نمودیم. به منظور تولید مدل های زبانی N-gram، این متن ها به دودسته آموزشی و آزمون تقسیم شدند. از دیکشنری تخصصی (10332 کلمه) برای غلط یابی کلمات تخصصی و از دیکشنری عمومی (1095959 کلمه) برای غلط یابی کلمات غیرتخصصی بهره گرفتیم. کلیه مراحل پیاده سازی در محیط Visual Studio و به زبان برنامه نویسی C# انجام گرفت و خروجی سیستم در قالب افزونه قابل نصب در محیط Word و DLL برای نصب و استفاده در HIS ایجاد شد. درنهایت کارایی سیستم را بر روی تشخیص کلمه غلط و تصحیح آن با معیارهای Accuracy، Precision، F-measure و Recall مورد ارزیابی قراردادیم.یافته ها: در فرایند تشخیص غلط های املایی، محدوده F-measure سیستم پیاده سازی شده، بر روی مجموعه متون آزمون، از 89.76%(بر روی متون سونوگرافی پستان) تا %09/91(بر روی متون سونوگرافی شکم و لگن) به دست آمد. دقت تصحیح سیستم، دارای محدوده 1/82%(متون سونوگرافی پستان) تا 80/89%(متون سونوگرافی سر و گردن) هست. رنج دقت تصحیح بر روی مجموعه داده های آموزشی 45/%92 تا 33/94% محاسبه گردید. با بهره گیری از سیستم ارائه شده، 91.6 درصد غلط های املایی (852 غلط) موجود در متون آزمون سونوگرافی تصحیح شدند.نتیجه گیری: نتایج این پژوهش نشان می دهد که تشخیص و تصحیح غلط های املایی با کارایی بالابر روی گزارش ها بالینی امکان پذیر است. وجود سامانه های تشخیص و تصحیح خودکار غلط های املایی می تواند علاوه بر بهبود کیفیت گزارش ها، منجر شوند که غلط های نگارشی به سرعت در زمان نگارش تصحیح گردند که این امر صرفه جویی قابل توجهی در مدت زمان فرایند نگارش و تائید نهایی گزارش ها در بخش رادیولوژی و سونوگرافی را به همره دارد و اثر MUDA را کاهش خواهد داد.

Authors

آزیتا یزدانی

دکترای تخصصی انفورماتیک پزشکی، گروه مدیریت و فناوری اطلاعات سلامت، دانشکده پیراپزشکی، دانشگاه علوم پزشکی تهران، تهران، ایران.

مرجان قاضی سعیدی

دانشیار، گروه مدیریت و فناوری اطلاعات سلامت، دانشکده پیراپزشکی، دانشگاه علوم پزشکی تهران، تهران، ایران.

مهران آماده رستمی

دانشجوی کارشناسی اطلاعات سلامت، گروه مدیریت و فناوری اطلاعات سلامت، دانشکده پیراپزشکی، دانشگاه علوم پزشکی تهران، تهران، ایران.

نسرین احمدی نژاد

دانشیار، مرکز تحقیقات سرطان انستیتو کانسر، دانشگاه علوم پزشکی تهران، تهران، ایران.

معصومه گیتی

استاد، مرکز تحقیقات بیماریهای پستان، انستیتو کانسر، دانشگاه علوم پزشکی تهران، تهران، ایران

حبیبه امجدی

کارشناس ارشد آموزش بهداشت، مرکز تحقیقات سرطان انستیتو کانسر، دانشگاه علوم پزشکی تهران، تهران، ایران

آذین نحوی جو

استادیار، مرکز تحقیقات سرطان انستیتو کانسر، دانشگاه علوم پزشکی تهران، تهران، ایران.