CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تقویت معیار شباهت معنایی بین صفحات وب بر اساس درجه معناداری ارتباط کلمات

عنوان مقاله: تقویت معیار شباهت معنایی بین صفحات وب بر اساس درجه معناداری ارتباط کلمات
شناسه ملی مقاله: KBEI03_093
منتشر شده در سومین کنفرانس بین المللی مهندسی دانش بنیان و نوآوری در سال 1395
مشخصات نویسندگان مقاله:

سامان صلواتی - دانشجوی کارشناسی ارشد مهندسی کامپیوتر، نرمافزارموسسه آموزش عالی دیلمان لاهیجان
فاطمه احمدی آبکناری - استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات،دانشگاه پیام نور رشت، ایران
راهبه مجتهدی صفاری - مربی، گروه مهندسی کامپیوتر و فناوری اطلاعات، ۳دانشگاه آزاد اسلامی لاهیجان

خلاصه مقاله:
سنجش تشابه معنایی صفحات وب، از اقدامات مهمی است که کاربردهای قابل ملاحظه ای خصوصا در حوزه ی موتورهای جستجو به منظور استخراج صفحات هم معنا دارد. در این پژوهش، با مطالعه روش های موجود اندازه گیری شباهت بین صفحات بر اساس معیار رخداد کلمات با استفاده از محیط نرمافزار رپیدماینر، جفت کلمات از صفحات استخراج و با استفاده از موتور جستجوی گوگل مورد جستجو قرار گرفت. تعداد صفحات با استفاده از روشهای ضریب همپوشانی، ضریب شباهت کسینوسی، ضریب سیمپسون و ضریب PMI مقایسه گردید. در روش پیشنهادی این پژوهش با تکیه بر روش PMI به تقویت پاسخ نهایی با در نظر گرفتن ارتباط معنایی جفت کلمات اولیه بر اساس درجه شباهت استخراج شده از WordNet و داتره المعارف های تخصصی با اعمال ضرایب پرداخته شد و معیار شباهت نهایی PMIS نامیده شد. نتایج بدست آمده، بیانگر میزان شباهت معنایی بهتر و با معناتر بین صفحات در صورت ارتباط معنایی معنی دار در کلمات رخداده شده میباشند

کلمات کلیدی:
تشابه معنایی صفحات وب، رخداد کلمات مشابه درصفحات وب، کلمات مترادف، معیارهای شباهت صفحات وب

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/623098/