آشنایی با روش های رفع اطلاعات نویزی در صفحات وب برای داده کاوی

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 521

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CEITCONF01_127

تاریخ نمایه سازی: 26 مرداد 1397

Abstract:

یک صفحه وب تجاری معمولا حاوی اطلاعات زیادی است بلوک هایی به غیر از بلوک های محتوااصلی، معمولا چنین است بلوک هایی چون پانل های ناوبری، اطلاعیه های کپی رایت و حریم خصوصی، و تبلیغات (برای اهداف کسب و کار و برای دسترسی آسان به کاربران). ما این بلوک ها را که بلوک های اصلی محتوا نیستند بلوک های پر سر و صدا می نامیم. ما نشان می دهیم که اطلاعات موجود در این بلوک های پر سر و صدا می تواند به طور جدی به وب کاوی آسیب بزنند و از بین بردن این سر و صدا از اهمیت زیادی برخوردار است.دراین با روش هایی برای حذف این داده ها آشنا می شویم و هدف آشنایی مختصری با برخی مفاهیم داده کاوی خوشه بندی و طبقه بندی داده ها می باشد.

Keywords:

Authors

فاطمه تنهایی ادیمی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، موسسه ی آموزش عالی هاتف زاهدان

سمانه زرگری

دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، موسسه ی آموزش عالی هاتف زاهدان