رهیافتی جدید برای خوشهبندی جریان متن
Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,277
متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICIORS02_076
تاریخ نمایه سازی: 11 اسفند 1387
Abstract:
خوشهبندی جریان متن مسئله مهمی در دادهکاوی است و کاربردهای بسیار از جمله فیلترسازی گروههای خبری، خزش متن و سازماندهی متنها دارد. بیشتر روشهای خوشهبندی جریان متن، رهیافت مبتنی بر مشابهت را بکار میبرند. این روشها از طرح TF-IDF استفاده میکنند و کیفیت ضعیفی ارائه میدهند. در مقابل، مدل هموارساز مفهومی، کیفیت خوشهبندی را بهبود می بخشد ولی هنوز در تشخیص و نادیده گرفتن کلمات کلی موفق نیست. در این پروژه، مدل هموارساز مفهومی موجود را بهبود بخشیدهایم. همچنین روشی برای تخمین احتمال ترجمه کلمات و عبارات چند کلمهای جدید ارائه کردهایم. به این ترتیب کیفیت خوشهبندی جریان متن بهبود یافته است.
Keywords:
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :