ارائه روشی جدید برای پاکسازی داده ها جهت بهبود کیفیت انبارداده

Publish Year: 1399
نوع سند: مقاله ژورنالی
زبان: Persian
View: 157

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_IMPCS-1-2_009

تاریخ نمایه سازی: 20 دی 1401

Abstract:

مهمترین مسئله در مدیریت داده­ ها، موضوع کیفیت داده است. کیفیت داده می تواند پاکسازی داده ها را قبل از بارگذاری به انبار داده ها تضمین­ کند. پاکسازی داده فعالیتی است شامل فرآیند تشخیص و اصلاح اشتباهات و تناقضات در انبار داده­ ها. به ­دلیل وجود اطلاعات زیاد در بانک ­های اطلاعاتی مشکلات و تناقضات فراوانی درآن­ها به ­وجود آمده ­است. هدف اصلی ما ارائه روشی برای رفع تناقضات موجود در بانک های اطلاعاتی برای پاکسازی داده های آلوده می باشد. با هدف بهبود کیفیت انبار داده برای تصمیم گیری های صحیح، روش جدیدی ارائه­ شده­ است و برای آزمایش روش پیشنهادی، از بانک اطلاعاتی شناسنامه سلامت دانشجویان دانشگاه علوم پزشکی زنجان ورودی سال­های ۹۲ و ۹۳، شامل ۸۴۵  نفر که در حال حاضر همه آن­ها فارغ التحصیل شده اند به­ عنوان داده ­های مورد بررسی استفاده ­شده ­است. برنامه پیشنهادی با زبان برنامه نویسی سی شارپ پیاده سازی و اجرا شده­ است. برنامه یا اپلیکیشن ما در چهار لایه و به صورت ویندوز اپلیکیشن نوشته­ شده­ است. از طریق  اجرای روش پیشنهادی توانستیم با بررسی کدملی دانشجویان، داده های آلوده در این مشخصه را تشخیص ­داده و سپس فرآیند اصلاح داده را روی آن­ها اعمال ­نماییم. براساس نتایج به دست ­آمده، میزان داده آلوده در انبار داده تولید­شده از ۲۵.۷۹ درصد به ۴.۹۷ درصد کاهش ­یافت.

Authors

علی شهنواز

گروه آموزشی ریاضی و آمار، دانشگاه آزاد اسلامی واحد زنجان، زنجان، ایران

مهدی افضلی

گروه آموزشی مهندسی فن آوری اطلاعات، دانشگاه آزاد اسلامی واحد زنجان، زنجان، ایران

شیما رحیم زاده

دانشگاه علوم پزشکی و خدمات درمانی و بهداشتی زنجان، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :