داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

مهدی محمدیان

داده کاوی در داده های عظیم: یافتن نزدیک ترین همسایه به کمک درهمسازی میانی

Publish place: 16th conference on Recent Research in Science and Technology

Publish Year: 1397

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 9 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/932732

شناسه ملی سند علمی:

EMAA16_029

تاریخ نمایه سازی: 7 مهر 1398

Abstract:

یکی از مسائل اساسی در داده کاوی داده های عظیم، یافتن نزدیک ترین همسایه به یک بردار مورد پرسوجوست. حجم انبوهی از داده ها که ممکن است ابعاد بالائ ی نیز داشته باشند، با استفاده از یک معیار فاصله یا شباهت جهت یافتن نزدیک ترین همسایه کنکاش می شوند. وجود این حجم عظیم از داده ها بر روی حافظه های مانا و پرهزینه بودن عملیا ت های ورودی/خروجی جهت یافتن نزدیک ترین همسایه، سبب شده است تا مسئله یافتن نزدیک ترین همسایه از نظر زمان و فضا بسیار پرهزینه باشد. تحقیقات گسترده ای که پیرامون این مسئله صورت گرفته است منجر به هور الگوریتم های شده است که قادرند با استفاده از توابع درهمساز، نزدیک ترین همسایه تقریبی یک پرس و جو را که تقریب آن قابل قبول باشد، به عنوان خروجی برگردانند. به این دسته از توابع، توابع درهمساز میانی گفته می شود. این الگوریتم ها توانسته اند از نظر دقت، فضا و زمان، عملکرد مناسبی را از خود نشان دهند. در این مقایسه قصد داریم تا به صورت کلی به معرفی این دسته از الگوریتم ها بپردازیم

Keywords:

داده کاوی , داده های عظیم , نزدیک ترین همسایه , درهمسازی , درهمسازی میانی

Authors

مهدی محمدیان

مربی، دانشکده مهندسی کامپیوتر، دانشگاه پیام نور تهران ایران / دانشجوی مقطع دکتری، گرایش نرم افزار، دانشگاه علم و صنعت، تهران