دسته بندی متون به کمک الگوریتم KNN بهبود یافته مبتنی بر خوشه های وزن دار

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 2,763

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CEIT01_175

تاریخ نمایه سازی: 9 تیر 1393

Abstract:

دسته بندی متون یکی از شاخه های متن کاوی است که به طور خودکار متون را طبقه بندی می نماید. تاکنون روشهای مفید بسیاری با رویکرد رده بندی مبتنی بر ناظر برای دسته بندی متون معرفی شده اند. در بین این روشها الگوریتم K نزدیکترین همسایه یا KNN به طور وسیع مورد استفاده قرار می گیرد، که به علت سادگی و بی پارامتر بودن و کارایی دسته بندی ( دقت دسته بندی) آن یکی از بهترین روشها است. اما روش سنتی KNN پیچیدگی محاسباتی بالایی دارد و این نقیصه از کاربردی بودن KNN می کاهد. خوشه بندی یک راه حل برای این مشکل است، به این روش که تعداد نمونه های یادگیری در دسته بندی را کاهش می دهد و به این طریق از پیچیدگی زمانی محاسبات می کاهد. در این مقاله، ما یکی از روشهای ساده مبتنی برای خوشه بندی الگوریتم KNN را که قبلا پیشنهاد شده است، انتخاب کرده ایم. این روش بوسیله خوشه بندی پیچیدگی زمانی را تا حد زیادی کاهش می دهد ولی مقداری از کارایی دسته بندی می کاهد. ما یک مقدار وزنی به مرکز خوشه ها نسبت می دهیم و همچنین مقدار K در الگوریتم KNN را کاهش می دهیم . آزمایشها برروی مجموعه داده محک Reuter-21578 نشان می دهد که این روش می تواند کارایی دسته بندی را افزایش دهد.

Authors

زهرا صفیان بلداجی

دانشجوی کارشناسی ارشد مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد

محمد نادری دهکردی

استادیار گروه کارشناسی ارشد نرم افزاز دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد،

حمید رستگار

استادیار گروه کارشناسی ارشد نرم افزاز دانشگاه آزاد اسلامی واحد نجف آباد، نجف آباد،

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • [1] Chen T, Xie Y Q, Reviewv of Feature Reduction ...
  • [2] Su Jinshu, Zhang Bofeng, Xu Xin, Advances in Machine ...
  • Information, 24 (6): 690-684., 2005 ...
  • [3] Fang Lu, Qingyuan Bai, A Refined Weighted K- Nearest ...
  • _ _ _ _ _ _ K-NN Text classification, Proceedings ...
  • [5] Li Juan, TKNN: _ improved KNN algorithm based on ...
  • [6] Imad Rahal , William Perrizo, An Optimized Approach for ...
  • [7] Lijuan Zhou, Linshuang Wang, Xuebin Ge and Qian Shi, ...
  • _ _ _ _ Cluster in Text Classification, IEEE, International ...
  • _ _ Yuan Jiao, Text Categorization Research Based on Cluster ...
  • [10] XindongWu : Vipin Kumar And others, Top 10 algorithms ...
  • [11] Luigi Galavotti, Fabrizio Sebastiani, and Maria Simi, Experiments on ...
  • Computer Science: series, number 1923. ...
  • نمایش کامل مراجع