بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار

وحیده نمکی

بررسی روش های موجود تطابق رکورد و بهبود بهره وری تشخیص تکرار

Publish place: 5th National Conference on Application of Novel Technologies in Engineering Sciences

Publish Year: 1399

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 12 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1202827

شناسه ملی سند علمی:

ITCC05_097

تاریخ نمایه سازی: 22 اردیبهشت 1400

Abstract:

روش های متعددی برای تطبیق فیلدها و نحوه محاسبه میزان شباهت برای فیلدها مطرح است با توجه به این موضوع که پایگاه داده ها متشکل از رکوردها می باشند و این رکوردها به نوبه خود از فیلدهای متنوعی ساخته می شوند، بنابراین تشخیص تکرار در سطح رکورد کاری بس دشوار و پیچیده نسبت به سطح فیلد می باشد. در این مقاله هدفمان بررسی روش های مختلف برای تخمین میزان شباهت رکوردها در پایگاه داده ها می باشد. روش های ذکر شده بطور گسترده به دو دسته کلی تقسیم می شوند: روش هایی که مبتنی بر داده های آموزشی هستند تا "یاد بگیرند" که چگونه رکوردها را باهمتطبیق دهند، مدل های احتمالی و تکنیک های یادگیری ماشین در این قسمت قرار می گیرند و روش هایی که مبتنی بر دانش دامنه و یا معیارهای فاصله برای تطبیق رکوردها هستند. این قسمت شامل رویکردهایی است که از زبان های توصیفی برای تطبیق و همچنین روش هایی که از معیارهای فاصله،مناسب برای کار تشخیص تکرار استفاده می کنند. در این مقاله سعی خواهد شد روش ها را ارائه و با یکدیگر مقایسه گردد.

Keywords:

تطبیق , خوشه بندی , SVM

Authors

وحیده نمکی

کارشناسی ارشد نرم افزار دانشگاه آزاد اسلامی شبستر