روشی جدید برای خوشه بندی مستندات متنی براساس آنتولوژی
Publish Year: 1386
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,622
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICIKT03_064
تاریخ نمایه سازی: 22 فروردین 1387
Abstract:
امروزه خوشه بندی نقش حیاتی در روشهای بازیابی اطلاعات برای سازمانبندی مجموعه های بزرگ مستندات متنی مانند وب، درون تعداد کمی خوشه معنادار دارد . معمولا در خوشه بندی مستندات متنی با خوشه بندی ابعاد بسیار بالای فضای داده مواجه هستیم که بندی به این شکل، مشکل بنظر می رسد . علاوه بر این، معمولا با استفاده از الگوریتم های خوشه بندی متفاوت، نتایج متفاوتی بدست می آید و مستندات درون خوشه های بدست آمده نیز ارتباط معنایی لازم را با هم ندارند . برای حل این مشکلات ما هسته انجام خوشه آنتولوژی مانند وردنت را به عنوان دانش پس زمینه، درون فرایند خوشه بندی مستندات متنی جایگذاری نمودیم . سپس به صورت تجربی روش جدید را با تکنیکهای خوشه بندی ساده برای مجموعه داده خبرگزاری رویتر مقایسه نمودیم . نتایج بدست آمده از خوشه بندی متن همراه با استفاده از دانش پس زمینه در مقایسه با خوشه بندی متن بدون دانش پس زمینه، بهبود داشته است .
Keywords:
Authors
احسان عسگریان
دانشگاه صنعتی شریف
جعفر حبیبی
دانشگاه صنعتی شریف
شهروز معاون
دانشگاه صنعتی شریف
حسین معین زاده
دانشگاه علم و صنعت
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :