CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

آشنایی با روش های رفع اطلاعات نویزی در صفحات وب برای داده کاوی

عنوان مقاله: آشنایی با روش های رفع اطلاعات نویزی در صفحات وب برای داده کاوی
شناسه ملی مقاله: CEITCONF01_127
منتشر شده در کنفرانس ملی کامیپوتر،فناوری اطلاعات و کاربردهای هوش مصنوعی در سال 1396
مشخصات نویسندگان مقاله:

فاطمه تنهایی ادیمی - دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، موسسه ی آموزش عالی هاتف زاهدان
سمانه زرگری - دانشجوی کارشناسی ارشد مهندسی کامپیوتر نرم افزار، موسسه ی آموزش عالی هاتف زاهدان

خلاصه مقاله:
یک صفحه وب تجاری معمولا حاوی اطلاعات زیادی است بلوک هایی به غیر از بلوک های محتوااصلی، معمولا چنین است بلوک هایی چون پانل های ناوبری، اطلاعیه های کپی رایت و حریم خصوصی، و تبلیغات (برای اهداف کسب و کار و برای دسترسی آسان به کاربران). ما این بلوک ها را که بلوک های اصلی محتوا نیستند بلوک های پر سر و صدا می نامیم. ما نشان می دهیم که اطلاعات موجود در این بلوک های پر سر و صدا می تواند به طور جدی به وب کاوی آسیب بزنند و از بین بردن این سر و صدا از اهمیت زیادی برخوردار است.دراین با روش هایی برای حذف این داده ها آشنا می شویم و هدف آشنایی مختصری با برخی مفاهیم داده کاوی خوشه بندی و طبقه بندی داده ها می باشد.

کلمات کلیدی:
اطلاعات نویزی،وب کاوی، طبقه بندی صفحات وب، خوشه بندی وب، تشخیص نویز

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/762590/