تشخیص ناهنجاری در داده های خط سیر با استفاده از تخمین تراکم مرکزی و خوشه بندی سلسله مراتبی
Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 539
This Paper With 12 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CITCOMP05_060
تاریخ نمایه سازی: 22 مرداد 1399
Abstract:
در این تحقیق داده های خط سیر دو نقطه مشخص و به دست آوردن نمونه های ناهنجار مورد بررسی قرار گرفته است.ابتدا بااستفاده از معیارهای فاصله ،ماتریس فاصله را ایجاد می کنیم. از این ماتریس برای ایجاد کردن خوشه ها در روش خوشه بندیسلسله مراتبی استفاده می کنیم. ما در این تحقیق از روش Chameleon استفاده خواهیم کرد که به نوعی گراف در آن نقش اساسی دارد.از مزایای این روش می توان به پویا بودن مفهوم همسایگی اشاره کرد. در مرحله بعد پیدا کردن تعداد مطلوب خوشهها در روش خوشه بندی سلسله مراتبی مد نظر می باشد. در این حوزه روش ها و ایده های زیادی مطرح شده است. زانو در یک منحنی خطا روشی شناخته شده برای تعیین تعداد مناسب خوشه یا افرازها است. در این روش دستیابی به تعداد بهینهتعداد خوشه ها با درصد بالایی از دقت در دسترس خواهد بود. این روش برای جلوگیری از قرارگیری زانو (knee) در مکان غیر واقعی خود (ناشی از تاثیر داده های پرت)، همه نکات را در نظر می گیرد. در ادامه با به دست آمدن تعداد بهینه خوشه ها دادهها الگوریتم سلسله مراتبی می شود. خوشه های به دست آمده با تراکم بالا به عنوان داده های هنجار شناخته شده و خوشههای با تراکم بسیار پایین به عنوان ناهنجاری تلقی می شود.
Authors
محمدرضا عباسی فرد
دانشگاه ادیبان ، گرمسار ، ایران
میثم بیات
دانشگاه ادیبان ، گرمسار ، ایران