داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 431

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

EMAA16_029

تاریخ نمایه سازی: 7 مهر 1398

Abstract:

یکی از مسائل اساسی در داده کاوی داده های عظیم، یافتن نزدیک ترین همسایه به یک بردار مورد پرسوجوست. حجم انبوهی از داده ها که ممکن است ابعاد بالائ ی نیز داشته باشند، با استفاده از یک معیار فاصله یا شباهت جهت یافتن نزدیک ترین همسایه کنکاش می شوند. وجود این حجم عظیم از داده ها بر روی حافظه های مانا و پرهزینه بودن عملیا ت های ورودی/خروجی جهت یافتن نزدیک ترین همسایه، سبب شده است تا مسئله یافتن نزدیک ترین همسایه از نظر زمان و فضا بسیار پرهزینه باشد. تحقیقات گسترده ای که پیرامون این مسئله صورت گرفته است منجر به هور الگوریتم های شده است که قادرند با استفاده از توابع درهمساز، نزدیک ترین همسایه تقریبی یک پرس و جو را که تقریب آن قابل قبول باشد، به عنوان خروجی برگردانند. به این دسته از توابع، توابع درهمساز میانی گفته می شود. این الگوریتم ها توانسته اند از نظر دقت، فضا و زمان، عملکرد مناسبی را از خود نشان دهند. در این مقایسه قصد داریم تا به صورت کلی به معرفی این دسته از الگوریتم ها بپردازیم

Authors

مهدی محمدیان

مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران