تقویت معیار شباهت معنایی بین صفحات وب بر اساس درجه معناداری ارتباط کلمات

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 772

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

KBEI03_093

تاریخ نمایه سازی: 11 مرداد 1396

Abstract:

سنجش تشابه معنایی صفحات وب، از اقدامات مهمی است که کاربردهای قابل ملاحظه ای خصوصا در حوزه ی موتورهای جستجو به منظور استخراج صفحات هم معنا دارد. در این پژوهش، با مطالعه روش های موجود اندازه گیری شباهت بین صفحات بر اساس معیار رخداد کلمات با استفاده از محیط نرمافزار رپیدماینر، جفت کلمات از صفحات استخراج و با استفاده از موتور جستجوی گوگل مورد جستجو قرار گرفت. تعداد صفحات با استفاده از روشهای ضریب همپوشانی، ضریب شباهت کسینوسی، ضریب سیمپسون و ضریب PMI مقایسه گردید. در روش پیشنهادی این پژوهش با تکیه بر روش PMI به تقویت پاسخ نهایی با در نظر گرفتن ارتباط معنایی جفت کلمات اولیه بر اساس درجه شباهت استخراج شده از WordNet و داتره المعارف های تخصصی با اعمال ضرایب پرداخته شد و معیار شباهت نهایی PMIS نامیده شد. نتایج بدست آمده، بیانگر میزان شباهت معنایی بهتر و با معناتر بین صفحات در صورت ارتباط معنایی معنی دار در کلمات رخداده شده میباشند

Keywords:

تشابه معنایی صفحات وب , رخداد کلمات مشابه درصفحات وب , کلمات مترادف , معیارهای شباهت صفحات وب

Authors

سامان صلواتی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرمافزارموسسه آموزش عالی دیلمان لاهیجان

فاطمه احمدی آبکناری

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه پیام نور رشت، ایران

راهبه مجتهدی صفاری

مربی، گروه مهندسی کامپیوتر و فناوری اطلاعات، ۳دانشگاه آزاد اسلامی لاهیجان