یک روش خوشه بندی توزیع شده مبتنی بر Kmeans برای حفظ محرمانگی در انتشار داده های حجیم

فاروق اشکوتی; رحیم رشیدی

یک روش خوشه بندی توزیع شده مبتنی بر Kmeans برای حفظ محرمانگی در انتشار داده های حجیم

Publish place: 1st International Conference and 6th National Conference on Computers, information technology and applications of artificial intelligence

Publish Year: 1401

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 19 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1675635

شناسه ملی سند علمی:

CEITCONF06_071

تاریخ نمایه سازی: 26 خرداد 1402

Abstract:

یکی از مراحل اساسی در چرخه حیات داده،انتشار آن برای تحلیل گران داده جهت کشف الگوهای مفید و ناشناخته است.انتشار داده ممکن است،باعث افشای ناخواسته اطلاعات افراد شود و مشکلاتی برای نامحرمانگی ایجاد کند.تحقیقات نشان داده ایت که گمنام سازی داده برای برا.رد کردن مدل های محرمانگی در داده های انتشاری یک روش کارا برای جلوگیری از افشای اطلاعات محرمانه افراد است.در این مقاله،برای گمنام سازی داده ها،از خوشه بندی سلسله مراتبی داده ها جهت براورد کردن مدل،l-diversity استفاده می شود. ما دو تابع فاصله جدید بر اساس فاصله منهتن و اقلیدس برای محاسبه فاصله رکورد ها در الگوریتم خوشه بندیk-means ارائه داده ایم،که این تابع نیاز های مدل محرمانگی l-diversity را داده های انتشاری براوره می کنند .یکی از نیاز های روش های گمنام سازی برقراری مصالحه بین محرمانگی و میزان استفاده از داده است. بنابراین در طراحی توابع فاصله پیشنهادی ،از معیار نزدیکی داده ها به همدیگر،بر اساس مدل محرمانگی l-diversity استفاده شده،تا مصالحه بهتری محرمانگی و استفاده داده به وجود اید.روش پیشنهادی این مقاله،به صورت توزیع شده و با استفاده از برنامه نویسی RDD ها در چهارچوب آپاچی سپارک رائه شده است،تا چالش سرعت در اعملیات گمنام سازی داده های حجیم و مقیاس پذیری روش پیشنهادی را حل نمیاد در اخر پیاده سازی و آزمایشات انجام شده کارایی و مفید بودن روش پیشنهادی را نشان داده است

Keywords:

گمنام سازی , مدل k-anonymity , مدلl-diversity , خوشه بندی سلسله مراتبی , فاصله اقلیدس , فاصله منهتن

Authors

فاروق اشکوتی

استادیار هیات علمی دانشگاه،گروه کامپیوتر ،واحد مهاباد،دانشگاه آز اد اسلامی،مهاباد،ایران

رحیم رشیدی

استادیار هیات علمی دانشگاه،گروه کامپیوتر ،واحد بوکان دانشگاه آزاد اسلامی ،بوکان،ایران