شناسایی رانش مفهوم در جریان داده و افراز فضای داده به مفاهیم مجزا

Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 71

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CDI20_015

تاریخ نمایه سازی: 18 فروردین 1403

Abstract:

بخش عظیمی از دنیای تکنولوژی امروز را سیستم های اطلاعاتی تشکیل داده اند که با جریانی پیوسته و سریع از داده کار می-کنند(جریان داده). رانش مفهوم یا تغییر توزیع داده در گذر زمان پدیده ای ذاتی در جریان داده است و اصلی ترین دلیل کاهش اثر بخشی سیستم های مبتنی بر استخراج اطلاعات از داده شناخته شده است. در این مقاله با استفاده از یک روش شناسایی رانش مفهوم ابتکاری و مبتنی بر gTest که اساس آن شمارش تکرار ویژگی های موثر در دسته بندی نمونه ها است، بر روی سه پایگاه دادگان واقعی رانش مفهوم را شناسایی کرده و براساس آن فضای داده به مفاهیم کوچکتر و مجزا تقسیم می شود. سپس با ایجاد مدل دسته بندی انحصاری برای هر مفهوم و افزایش تعداد مدل یادگیری در فضای داده، قادر خواهیم بود دقت پیش بینی و دسته بندی در یادگیری ماشین را بهبود ببخشیم.

Authors

امیر کتول

کارشناسی ارشد، دانشگاه گلستان دانشکده فنی مهندسی گرگان، گروه مهندسی کامپیوتر

مهدی یعقوبی

استادیار، دانشگاه گلستان، دانشکده فنی مهندسی گرگان، گروه مهندسی کامپیوتر