CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازیابی اسناد متنی با استفاده از آنتولوژی فازی

عنوان مقاله: بازیابی اسناد متنی با استفاده از آنتولوژی فازی
شناسه ملی مقاله: IDMC02_151
منتشر شده در دومین کنفرانس داده کاوی ایران در سال 1387
مشخصات نویسندگان مقاله:

سیدمهدی نقیبی
سیدمحمد رسولی
محمدرضا کنگاوری

خلاصه مقاله:
به دلیل قابلیت های فراوانی که آنتولوژی دارد، روش مناسبی جهت نمایش دانش دامنه محسوب می شود. در این مقاله روشی برای بازیابی اسناد متنی با استفاده از آنتولوژی فازی ارائه شده است. در یک آنتولوژی فازی، با اختصاص دادن درج هی عضویت به روابط بین مفاهیم، میزان اعتبار یک رابطه تعیین می گردد. بر مبنای روش ارائه شده، دانش دامنه ی مربوط به اسناد متنی، با استفاده از یک آنتولوژی فازی با تعریف هفت نوع رابطه ی فازی بین مفاهیم آن، مدل م یشود. این روابط عبارتند از: کلی کردن، اختصاصی کردن، جزء داشتن، جزء چیزی بودن، ویژگی داشتن، ویژگی چیزی بودن، و انجمنی مثبت. سپس با استفاده از آنتولوژی فازی ساخته شده و مجموع های از قوانین فازی، میزان اهمیت مفاهیم موجود در هر سند و بعد از آن میزان اهمیت مفاهیم غیر موجود اما مرتبط با هر سند، تعیین می شود و اسناد پردازش شده ساخته می شوند. با دریافت پرس و جوی کاربر، پردازشی مشابه با پردازش انجام شده روی سند ها، برای تعیین میزان اهمیت مفاهیم موجود و غیر موجود ولی مرتبط با پرس وجو ی کاربر انجام می شود. در نهایت اسناد پردازش شده ای که بیشترین شباهت را با پرس و جوی پردازش شده ی کاربر داشته اند، بازیابی می شوند. برای ارزیابی روش پیشنهادی مجموعه ای از اسناد متنی فارسی با موضوع دفاع مقدس جمع آوری و دانش دامنه ی مرتبط با آنها در یک آنتولوژی فازی مدل شده است. نتایج کار نشان م یدهد استفاده از روش ارائه شده باعث افزایش میانگین دقت بازیابی اسناد نسبت به روش های مرسوم آماری می شود.

کلمات کلیدی:
بازیابی اسناد متنی، آنتولوژی فازی، قوانین فازی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/70541/