روشی برای خوشه بندی داده های ترکیبی عددی و رسته ای

فائزه, حسینی نژاد; مریم, خادمی; میرمحسن, پدرام

روشی برای خوشه بندی داده های ترکیبی عددی و رسته ای

عنوان مقاله: روشی برای خوشه بندی داده های ترکیبی عددی و رسته ای
شناسه ملی مقاله: ICS11_131
منتشر شده در یازدهمین کنفرانس سراسری سیستم های هوشمند در سال 1391

مشخصات نویسندگان مقاله:

فائزه حسینی نژاد - دانشجوی کارشناسی ارشد مهندسی نرمافزار دانشگاه آزاد اسلامی واحد تهران جنوب
مریم خادمی - استادیار گروه ریاضی کاربردی دانشگاه آزاد اسلامی واحد تهران جنوب
میرمحسن پدرام - استادیار گروه مهندسی کامپیوتر دانشگاه خوارزمی

خلاصه مقاله:

خوشه بندی یکی از اعمال اصلی در داده کاوی است و به معنای گروه بندی نمونههای مشابه در خوشه ها است. این تکنیک به دنبال کشف ساختار در دادهها از طریق بررسی شباهت ها یا تفاوت های میان آنها است. بسیاری از الگوریتم های خوشه بندی بر روی مجموعه داده های عددی یا رست های به خوبی عمل می کنند اما بیشتر آنها بر روی داده های ترکیبی عملکرد ضعیفی دارند و این در حالی است که داده ها در دنیای واقعی ترکیبی از داده های رست های و عددی هستند. به همین دلیل توسعه الگوریتم هایی با قابلیت عملکرد بر روی این داده ها از اهمیت به سزایی برخوردار است. در این مقاله روش جدیدی برای خوشه بندی داده های ترکیبی ارائه می دهیم. در روش پیشنهادی ابتدا داده های رست های را به عددی تبدیل کرده سپس با استفاده از الگوریتم بهینه سازی cross entropy ، خوشه بندی را بر روی مجموعه داده نهایی که کاملاً عددی است، انجام خواهیم داد. در پایان این روش بر روی دو مجموعه داده استاندارد اعمال شده و کارایی آن با روش k-prototype که یکی از مهمترین الگوریتم ها در زمینه داده های ترکیبی است، مقایسه خواهد شد

کلمات کلیدی:

داده های ترکیبی، ویژگی های رست های، الگوریتم بهینه سازی cross entropy

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/214713/