بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 212

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCC05_097

تاریخ نمایه سازی: 22 اردیبهشت 1400

Abstract:

روش های متعددی برای تطبیق فیلدها و نحوه محاسبه میزان شباهت برای فیلدها مطرح است با توجه به این موضوع که پایگاه داده ها متشکل از رکوردها می باشند و این رکوردها به نوبه خود از فیلدهای متنوعی ساخته می شوند، بنابراین تشخیص تکرار در سطح رکورد کاری بس دشوار و پیچیده نسبت به سطح فیلد می باشد. در این مقاله هدفمان بررسی روش های مختلف برای تخمین میزان شباهت رکوردها در پایگاه داده ها می باشد. روش های ذکر شده بطور گسترده به دو دسته کلی تقسیم می شوند: روش هایی که مبتنی بر داده های آموزشی هستند تا "یاد بگیرند" که چگونه رکوردها را باهمتطبیق دهند، مدل های احتمالی و تکنیک های یادگیری ماشین در این قسمت قرار می گیرند و روش هایی که مبتنی بر دانش دامنه و یا معیارهای فاصله برای تطبیق رکوردها هستند. این قسمت شامل رویکردهایی است که از زبان های توصیفی برای تطبیق و همچنین روش هایی که از معیارهای فاصله،مناسب برای کار تشخیص تکرار استفاده می کنند. در این مقاله سعی خواهد شد روش ها را ارائه و با یکدیگر مقایسه گردد.

Authors

وحیده نمکی

کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی شبستر