دسته بندی متون فارسی با Naïve Bayes

شهریار زارع زاد; احمد حبیبی زادنوین; نیما جعفری زادنوین

دسته بندی متون فارسی با Naïve Bayes

Publish place: The Second International Conference and the Third National Conference on the Application of New Technologies in Engineering Sciences

Publish Year: 1394

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 10 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/501792

شناسه ملی سند علمی:

ITCC02_164

تاریخ نمایه سازی: 21 شهریور 1395

Abstract:

در چند سال اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است. اغلب کارهای انجام شده برروی اسناد به زبان انگلیسی بوده و اخیرا در مورد زبان هایی مثل چینی و عربی کارهایی انجام شده است. در این مقالهیک دسته بندی کننده اسناد فارسی با استفاده از روش نیو بیز پیشنهاد شده است و دلیل استفاده از این الگوریتم موفقیت زیاد آن در دسته بندی اسناد مشابه در زبان انگلیسی بوده است این دسته بند بوسیله متون فارسی پیکره همشهری 2 موردآزمایش قرار داده شد. در این آزمایش 6 دسته مختلف از پیکره انتخاب شده بود که در این میان، برای دسته هایهنری، مذهبی، ورزشی و علمی دقت و بازخوانی یک بدست آمد که بهترین عملکرد ممکن می باشد و برای دستهپزشکی دقت 0.917 و بازخوانی یک و برای دسته رایانه بازخوانی 0.9 و دقت 1 بدست آمد.

Keywords:

دسته بندی , متون فارسی , نیوبیز

Authors

شهریار زارع زاد

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

احمد حبیبی زادنوین

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

نیما جعفری زادنوین

گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

Agarwal, B., Mittal, N. (2014). Text classification using machine learning ...
Aggarwal, C.C. (2012). Mining Text Data, Springer, (Ch. A Survey ...
Al-Shalabi, R., Kanaan, Gh. (2006). "Arabic Text Categorization Using KNN ...
Altyncay, h., Erenel, z. (2010). Analytical evaluation of term weighting ...
Amiri, H., AleAhmad, A. and et. al.(2008). "Keyword Suggestion Using ...
Baeza-Yates, R., Ribeiro-Neto, B. (1999). Chapter 3 Retrieval evaluation. In ...
Basiri, M., Neimati, Sh., ghasem aghayi, N. (2007). _ Compare ...
Dahmouyad, A. (2007). "automatic classification of ...
Csurka, G., Dance, C.R., Fan, L., Willamowski, J., Bra, C., ...
Debole, f., Sebastiani, f.(2003). Supervised term weighting for automated text ...
Djuric, n., Lan, I., Vucetic, s., Wang, z. (2013). Budgetedsvm: ...
Computing, SAC 03, ACM, New York, NY, USA, 2003, pp. ...
«1 Intcrmationl Confcrcncc & 3"" National Confcrcncc on Ncw Tcchnologics ...
Elahimanesh, M.H., Minaei, B., and Malekinezhad, H. (2012). Improving K-nearest ...
Forman, G. (2003), An extensive empirical study of feature selection ...
classification of Persian documents by means of Naive Bayes and ...
Kanaan, gh., Al-Shalabi, r., Al-Akhras, a. (2006). "KNN Arabic Text ...
Khreisat, L.(2004). Arabic Text Classification using N-gram frequency statistics, tech. ...
Khreisat, L., (2009). _ A Machine learning approach for Arabic ...
Su, J., Lu, Y. (2009). Supervised and traditional term ...
weighting methods for automatic text categorization, Trans. PAMI 31 (4) ...
Maghsoodi, N., H omayoumpou. M.M., (2011). Improving Farsi multiclass text ...
identification system using robust features, Int. J. Speech Technol. 17 ...
Rama sundaram, S., Victor, S.P. (2010). "Text Categorization by B ...
Salton, G., Yang, C.S., (1973). On the specification of term ...
Manchala, S., Prasad, V.K., Janaki, V., (2014). ...
«1 Intcrmationl Confcrcncc & 3"" National Confcrcncc on Ncw Tcchnologics ...
Salton, G., Buckley, C. (1988), T erm-weighting approaches in automatic ...
Sebastiani, F.(2002). "machine learning in automated tex _ ategorization" _ ...
Sebastiani, F., (2008). Machine learning in automated tex categorization, ACM ...
Sivic, J., Zisserman, A. (2003). Video Google: _ text retrieval ...
Tam, V., Santoso, A., Setiono, R. (2002). _ comparative study ...
Turney, P., Pantel, P. (2010). From frequency to meaning: vector ...
Wang, P., Domeniconi, C., (2008). Building semantic kernels for text ...
Wang, Z., Sun, X., Zhang, D., Li, X.(2006)."An Optimal SVM-Based ...
Wanga, J. Liub, P., Shea, M.F., Nahavandia, S., Kouzanid, A. ...
Yang, Y., Pedersen, J.O. (1997). A comparative study on feature ...
Yari, A.. abbasi, A. and Moemen Bellah, S. (2010). Presenting ...
categorization, " In Proceeding of the _ Recognition, pp. 235-238. ...

نمایش کامل مراجع