CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص ناهنجاری در داده های خط سیر با استفاده از تخمین تراکم مرکزی و خوشه بندی سلسله مراتبی

عنوان مقاله: تشخیص ناهنجاری در داده های خط سیر با استفاده از تخمین تراکم مرکزی و خوشه بندی سلسله مراتبی
شناسه ملی مقاله: CITCOMP05_060
منتشر شده در پنجمین کنفرانس ملی مهندسی کامپیوتر و بلاک چین ایران در سال 1399
مشخصات نویسندگان مقاله:

محمدرضا عباسی فرد - دانشگاه ادیبان ، گرمسار ، ایران
میثم بیات - دانشگاه ادیبان ، گرمسار ، ایران

خلاصه مقاله:
در این تحقیق داده های خط سیر دو نقطه مشخص و به دست آوردن نمونه های ناهنجار مورد بررسی قرار گرفته است.ابتدا بااستفاده از معیارهای فاصله ،ماتریس فاصله را ایجاد می کنیم. از این ماتریس برای ایجاد کردن خوشه ها در روش خوشه بندیسلسله مراتبی استفاده می کنیم. ما در این تحقیق از روش Chameleon استفاده خواهیم کرد که به نوعی گراف در آن نقش اساسی دارد.از مزایای این روش می توان به پویا بودن مفهوم همسایگی اشاره کرد. در مرحله بعد پیدا کردن تعداد مطلوب خوشهها در روش خوشه بندی سلسله مراتبی مد نظر می باشد. در این حوزه روش ها و ایده های زیادی مطرح شده است. زانو در یک منحنی خطا روشی شناخته شده برای تعیین تعداد مناسب خوشه یا افرازها است. در این روش دستیابی به تعداد بهینهتعداد خوشه ها با درصد بالایی از دقت در دسترس خواهد بود. این روش برای جلوگیری از قرارگیری زانو (knee) در مکان غیر واقعی خود (ناشی از تاثیر داده های پرت)، همه نکات را در نظر می گیرد. در ادامه با به دست آمدن تعداد بهینه خوشه ها دادهها الگوریتم سلسله مراتبی می شود. خوشه های به دست آمده با تراکم بالا به عنوان داده های هنجار شناخته شده و خوشههای با تراکم بسیار پایین به عنوان ناهنجاری تلقی می شود.

کلمات کلیدی:
ناهنجاری، خط سیر، آنومالی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1037962/