الگوریتم های خوشه بندی در داده های عظیم

شیرین عباسی; بابک وزیری

الگوریتم های خوشه بندی در داده های عظیم

Publish place: National Conference on Information Technology, Computer & Communication

Publish Year: 1394

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 14 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/451240

شناسه ملی سند علمی:

ITCC01_453

تاریخ نمایه سازی: 9 فروردین 1395

Abstract:

پردازش داده های عظیم و مدیریت آنها، در سال های اخیر، موردتوجه قرارگرفته است و چارچوب ها وابزارهای خاصی به این منظور معرفی شده اند و تجزیه وتحلیل داده ها بهعنوان مدیریت داده های عظیم،مورد مطالعه قرارگرفته اند. تکنیک های داده کاوی و یادگیری ماشین، امروزه در بسیاری از سازمان ها و صنایعبه منظور بهبود و پیش بینی و رونق کسب وکار مورداستفاده قرار می گیرند و با توجه به رشد اطلاعات سازمانیو حجم بالای آنها و تولید داده ها با سرعت بالا، تکنیک های داده کاوی در داده های عظیم، نقش مهمی را دراین تحولات ایفا می کنند. عملیات مختلفی برای مدیریت داده ها صورت می گیرد که گروهی از این عملیاتبه صورت پیش پردازش هایی هستند که بر روی داده ها انجام می شوند تا داده ها را برای انجام عملیات اصلی،آماده سازند. از طرفی در محیط های ابری، به دلیل توزیع شدگی محیط، عملیات گروه بندی و دسته بندیداده ها، اهمیت زیادی می یابد. در این مقاله، معروفترین الگوریتم خوشه بندی، K-Means ، موردبررسیقرارگرفته و بنا بر کارهای صورت گرفته بر روی این الگوریتم، روش هایی پیشنهاد می گردد که پارامترهایمهم در محیط های ابری را در نظر گرفته و خوشه بندی داده های عظیم را بهبود بخشد.

Keywords:

خوشه بندی , داده های عظیم , مدیریت داده های عظیم , ذخیره سازی ابری , رایانش ابری , K-Means

Authors

شیرین عباسی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد تهران مرکز

بابک وزیری

استادیار دانشگاه آزاد اسلامی واحد تهران مرکز

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

_ Internatiotal Conference om Information Technology, Computer & Communication 28 ...
_ Internatiotal Conference om Information Technology, Computer & Communication 28 ...
V. Hristidis, S. Chen, T. Li, S. Luis, and Y. ...
K. Grolinger, (20 1 3), "Disaster Dat Management in Cloud ...
D. Kossmann and T. Kraska, (2010), "Data Management in the ...
H.Dewan, R.Hansdah, (20 1 1), "A Survey of Cloud Storage ...
W. Halton, (2011), "Security Issues and Solutions in Cloud Computing", ...
F.Chung, J.Dean, (2008), "BigTable: a Distributed Storage System For Structured ...
W.Guo, C.Qiao, Y.Jin, (2010), _ D emonstration of Joint Resource ...
W.Vogels , (2009), "Eventually Consistent", ACM, Vol 52, No.1, PP.44-40. ...
P. Zadrozny and R. Kodali, (20 13), " Big Data ...
.]G.Decandia, D.Hastorun, M. Jampani, (2007), "Dynamo: Amazon highly Available Leyvalue ...
M. Stonebraker and et al, (2007), "The End of an ...
F. Ohlhorst, (2013), "Big Data Analytics: Turning Big Data into ...
A. Barrachina, A. O'Driscoll, (20 14), _ A big data ...
M.G. Jaatun, G. Zhao, and C. Rong (Eds.), (2009), : ...
F.Meyer, J. Chinrungrueng _ (2 004) _ _ Spatiotemporal clustering ...
J.Ernst, J.Nau, Z _ Bar-Joseph, (2 005), "Clustering short time ...
F.Iglesias, F.Kastner, (201 3), "Analysis of Similarity Measures in Times ...
9]A. Shirkhorshidi et al, (2014), Big Data Clustering: A Review", ...
C.Boutsidis, C .Chekuri, T.Feder, R. Motwani, (20 10), 'Random projections ...
1] G.Andradeand etal, (2013), " G-DB SCAN:A GPU Accelerated Algorithm ...
P.Anchalia, A. Koundinya, N. Srinath, (20 1 3), "MapReduce Design ...
B.Mirkin, (20 1 2), "Clustering for data mining a data ...
Y.He and et al, (2014), "MR-DB SCAN: _ scalable MapReduc ...
N.Shah, S. Mahajan, (20 14), Distributed Document Clustering Using K-Means", ...
Z.Le and et al, (2014), " K-means Clustering Optimization Algorithm ...
S.Su and et al, (2014), " Data Clustering Using Variants ...
A. Chadha, S.Kumar, _ Improved K-Means Clustering Algorithm: A Step ...

نمایش کامل مراجع