ترکیب روش های پردازش متن و داده کاوی جهت بهبود نتایج موتورهای جستجو برای مفاهیم تخصصی حوزه پزشکی abstract
با توجه به رشد روزافزون دانش و حجم عظیم داده های موجود در علوم مختلف، روش های سنتی برای دستیابی به اطلاعات جوابگوی نیازهای امروز بشر نیستند. به همین منظور، با پیشرفت علوم کامپیوتر، ابزارها ی تحت عنوان موتورها ی جستجو طراحی شده اند که می توانند اطلاعات درخواستی کاربران را از میان حجم انبوهی از داده یافته و به او ارایه نما یند . در این مقاله با ترکیب تکنیک های
داده کاوی و
پردازش متن یک روش جدید برای بهبود نتایج موتور های جست و جو در مفاهیم پزشکی ارایه شده است. پس از شبیه سازی روش پیشنهادی مشاهده گردید که روش پیشنهادی از لحاظ حافظه مصرفی، به صورت میانگین نسبت به روش DCI_PLUSدر حدود 5.52 برابر، نسبت به روش dCHARM حدود 11.70 برابر و در نها ی ت نسبت به روش NAFCP حدود 14.82 برابر بهبود داشته است. همچنین زمان اجرای روش پیشنهادی به صورت می انگین نسبت به روشDCI_PLUS در حدود 2.5 برابر، نسبت به روشdCHARM حدود 11.46 برابر و در نهای ت نسبت به روش NAFCP حدود 5.66 برابر بهبود داشته است. بطور کلی خطای روش پیشنهادی نسبت به سایر روشها بهینه تر م ی باشد . لذا خطا ی روش پیشنهادی نسبت به الگوریتم کا نزدیکترین همسایه 1.83 % بهبود داشته، نسبت به شبکه عصب ی 3.16 % و نسبت به الگوریتم نایوبیز 6.16 % می باشد. در نهایت نیز دقت روش پیشنهادی نسبت به سایر روشها بهینه تر می باشد. لذا دقت روش پیشنهادی نسبت به الگوریتم کا نزدیکترین همسایه 1.0005 % بهبود داشته، نسبت به شبکه عصب ی 1.0013 % و نسبت به الگوریتم نایوبیز 1.0031 % می باشد