ارائه یک روش ترکیبی جهت بهبود افزایش دقت دسته بندی اسناد علمی با استفاده از الگوریتم KNN و تکنیک شاخص گذاری معنایی پنهان

Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 890

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NICE01_030

تاریخ نمایه سازی: 30 دی 1394

Abstract:

در سال های اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است که از استراتژی های گوناگونی که اکثراً بر مبنای روش های باناظر می باشند، الگو گرفته اند. در واقع روش های زیادی جهت دسته بندی کردن اسناد ارائه شده اند که بدون توجه به مفاهیم نهفته درون متن، عملیات دسته بندی را انجام می دهند. تکنیک پیشنهادی ما در این مقاله این است ابتدا کلمات مهم و پرتکرار از متن اسناد علمی با استفاده از تکنیک TF-IDF بدست آمده و سپس با مقایسه با مفاهیم و کلمات کلیدی درخت سلسله مراتبی از رشته کامپیوتر، بتوان حوزه های کاری اسناد را بدست آورد و در نهایت با استفاده از یکی از تکنیک های پر کاربرد به نام LSI، از بین حوزه های تشخیص داده شده، بتوان دسته بندی را به طور تخصیص برای هر کدام از اسناد علمی انجام داد. در نهایت با استفاده از الگوریتم KNN، کار دسته بندی را انجام داد.

Authors

محمد کافیان

دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد نجف آباد

مهدی باطنی

استادیار گروه مهندسی کامپیوتر، دانشگاه شیخ بهایی اصفهان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Liu, Tao, et al. "Improving text classification using local latent ...
  • M. Granitzer, "Hierarchical text classification using methods from machine learning" ...
  • CLEVERDON, C. 1984. Optimizing convenient online access to bibliographic databases. ...
  • PAZIENZA, M. T., ed. 1997. Information Extraction. Lecture Notes in ...
  • KNIGHT, K. 1999. Mining online text. Commun. ACM 42, I1, ...
  • Alessandro Moschitti, "Answer Filtering via Text Categorization in Question Answering ...
  • Huang, Y. "Support vector machines for text categorization based _ ...
  • Slonim, N., Tishby, N., "Document Clustering using Word Cluster via ...
  • Steinbach, M., Karypis, G., Kumar, V., _ Comparison of Document ...
  • Dumais, S., et l. "Latent semantic indexing." Proceedings of the ...
  • De Lathauwer, L., et al. "Singular Value Decompo sition. _ ...
  • MANNNG, C. AND SCH:UTZE, H. 1999. Foundations of Statistical Natural ...
  • BORKO, H. AND BERNICK, M. 1963. Automatic document classification. J. ...
  • MERKL, D. 1998. Text classification with selforganizing maps: Some lessonslearne. ...
  • MARON, M. 1961. Automatic indexing: an experimental inquiry. J. Assoc. ...
  • SCHAPIRE, R. E. ANDD SINGER, Y. 2000. BoosTexter: a boosting-based ...
  • MYERS, K., KEARNS, M., SINGH, S., AND WALKER, M. A. ...
  • SABLE, C. L. AND HATZIVAS SILOGLOU, V. 2000. Textbased approaches ...
  • FORSYTH, R. S. 1999. New directions in text categorization. In ...
  • CAVNAR, W. B. AND TRENKLE, J. M. 1994. N-grambased text ...
  • KESSLER, B., NUNBERG, G., AND SCHUTZE, H. 1997. Automatic detection ...
  • FABRIZIO SEBASTIANI, "Machine Learning in Automated Text Categorization" , ACM ...
  • Li, B., Lu, Q., Yu, S., "An Adaptive k-Nearest Neighbor ...
  • Lin, Y, Qu, Y, Wang, Z., "A novel feature selection ...
  • Shang, W., Huang, H., Zhu, H., & Lin, Y., _ ...
  • Deerwester, S. C., Dumais, S. T., Landauer, T. K, . ...
  • Hofmann, R., "Probabilistic Latent Semantic Analysis, " in Proc. 15th ...
  • Lewis D.D. , Nive(Bayes) at Forty, The independence Assumption in ...
  • Dagan I., Engleson P, Committee -Based sampling for Training Probabilistic ...
  • Krotha, Rachitha Sony, and Madhavi Dabbiru. "A Novel Approach for ...
  • Rafi, Muhammad, and Mohammad Shahid Shaik. "An improved semantic similarity ...
  • نمایش کامل مراجع