CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

روشی مبتنی بر قاعده جهت بهبود کارایی سامانه های استخراج آزاد اطلاعات با استفاده از درخت تجزیه ی وابستگی

عنوان مقاله: روشی مبتنی بر قاعده جهت بهبود کارایی سامانه های استخراج آزاد اطلاعات با استفاده از درخت تجزیه ی وابستگی
شناسه ملی مقاله: ACCSI22_098
منتشر شده در بیست و دومین کنفرانس ملی سالانه انجمن کامپیوترایران در سال 1395
مشخصات نویسندگان مقاله:

وحیده رشادت - پژوهشکده فناوری اطلاعات، دانشگاه صنعتی مالک اشتر، تهران، ایران
مریم حورعلی - استادیار، پژوهشکده فناوری اطلاعات، دانشگاه صنعتی مالک اشتر، تهران، ایران
هتام فیلی - دانشیار، دانشکده مهندسی برق و کامپیوتر، دانشگاه تهران، تهران، ایران

خلاصه مقاله:
استخراج آزاد اطلاعات بر خلاف روش های پیشین استخراج اطلاعات، از معماری هایی که نیاز به مشخص کردن روابط از قبل دارند جلوگیری می کنند و محدود به روابط خاصی نیستند. بنابراین قادر به استخراج روابط دلخواه بطور مستقیم از مجموعه داده های بزرگ و دامنه های غیرهمگن مانند وب هستند. یک چالش اصلی برای سامانه های استخراج آزاد اطلاعات این است که روابط استخراج-شده نمونه های درستی از روابط بین موجودیت ها باشد. نیاز به استخراجگری که بتواند با اطمینان بالا به کشف اطلاعات بپردازد، از جمله اهداف استخراج آزاد اطلاعات است. در این راستا، در این مقاله روشی مبتنی بر قاعده پیشنهاد شده است که با کمک ویژگی های جمله و درخت تجزیه ی وابستگی، منجر به افزایش خروجی های درست و کاهش خروجی های نادرست و در نتیجه افزایش دقت و بازخوانی می شود. روش پیشنهادی به خروجی چندین سامانه استخراج آزاد اطلاعات اعمال شده و دقت نتایج تحت تاثیر آن بررسی شده است. ارزیابی ها نشان می دهد که روش پیشنهادی امیدبخش است و معیارهای کارایی خروجی ها با اعمال این روش بالاتر از حالت پایه است.

کلمات کلیدی:
پردازش زبان طبیعی، استخراج اطلاعات، استخراج آزاد اطلاعات، استخراج رابطه، درخت تجزیه ی وابستگی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/635640/