بهبود بکارگیری ابزار های داده کاوی جهت انتشار داده ها در مسائل دسته بندی با استفاده از ابزارهای داده کاوی

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 670

This Paper With 13 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CITCOMP01_131

تاریخ نمایه سازی: 16 شهریور 1395

Abstract:

یکی از مراحل اساسی در فرآیند کشف دانش در پایگاه داده ها، فاز انتشار داده ها است. برای نتیجه گیری مناسب از یک داده کاوی، این فاز از اهمیت خاصی برخوردار است چرا که اگر داده ها به طور صحیح آماده نشده باشند، نتایج تمام فاز های بعدی فرآیند به خطر می افتند. DMPML چهارچوبی است که داده های از پیش پردازش شده را برای الگوریتم های مختلف داده کاوی در یک سند XML ذخیره می کند و کد گذاری صحیح را با استفاده از یک سند XSLT مطابق با نیاز های الگوریتم داده کاوی بازیابی می نماید. این مقاله مقایسه ای بین DMPML و سه برنامه کاربردی داده کاوی (Weka، RapidMiner، KNIME) را ارائه می دهد که رویکرد گراف جهت دار را با در نظر گرفتن زمان صرف شده جهت ایجاد و اجرای وظایف انتشار داده ها برای دو الگوریتم داده کاوی بکار می گیرد. آزمایشات با استفاده از انواع مختلف مجموعه های داده ای: عددی، قطعی و ترکیبی اجرا می شوند. ما مشاهده کردیم که طرح بکار رفته توسط DMPML می تواند استفاده از الگوریتم های مختلف داده کاوی را ساده کند و به طور قابل ملاحظه ای زمان صرف شده جهت ایجاد وظایف انتشار داده ها را کاهش دهد.

Authors

سمیه عبادی

دپارتمان مهندسی کامپیوتر، دانشگاه پیام نور، تهران

معزالدین حجت الاسلامی

دپارتمان مهندسی کامپیوتر، دانشگاه مالک اشتر ، تهران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • J. Han and M Kamber, Data Mining: Concepts and Techniques, ...
  • D. Pyle, :Data collection, preparation, quality, and visualization, in The ...
  • M. Hall, E. Frank, G. Holmes, B. Pfahringer, P. Reutemann, ...
  • I. Mierswa, M. Wurst, R. Klinkenberg, M. Scholz, and T. ...
  • _ Knowledge Discovery and Data Mining, Ser. KDD _ NewYork, ...
  • M. R. Berthold, N. Cebron, F. Dill, T. R. Gabriel, ...
  • Learning and Applications, ser. Studies in Classification, Data Analysis, and ...
  • H.-Y. Lo, C.-M. Chang, T.-H. Chiang, C.-Y. Hsiao, A. Huang, ...
  • M. Kay, _ trans formations (xslt) version _ January 2007. ...
  • P. M. Gonc, alves, Jr. and R. S. M. Barros, ...
  • W. Du, and R. Lee, Eds. Los Alamitos, CA, USA: ...
  • _ E. Frank, M. Hall, G. Holmes, R. Kirkby, B. ...
  • M. R. Berthold, N. Cebron, F. Dill, T. R. Gabriel, ...
  • A. Frank and A Asuncion, :UCI machine learning repository, " ...
  • S. Haykin, Neural Networks and Learning Machine, 3rd ed. New ...
  • J. R. Quinlan, :Induction of decision trees, Machine Learning, vol. ...
  • I. H. Witten and E Frank, Data Mining: Practical Machine ...
  • M. Kay, _ SaXOn xslt and xquery processor." 2010. [Online]. ...
  • نمایش کامل مراجع