دسته بندی متون فارسی با Naïve Bayes
Publish place: The Second International Conference and the Third National Conference on the Application of New Technologies in Engineering Sciences
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 758
This Paper With 10 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCC02_164
تاریخ نمایه سازی: 21 شهریور 1395
Abstract:
در چند سال اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است. اغلب کارهای انجام شده برروی اسناد به زبان انگلیسی بوده و اخیرا در مورد زبان هایی مثل چینی و عربی کارهایی انجام شده است. در این مقالهیک دسته بندی کننده اسناد فارسی با استفاده از روش نیو بیز پیشنهاد شده است و دلیل استفاده از این الگوریتم موفقیت زیاد آن در دسته بندی اسناد مشابه در زبان انگلیسی بوده است این دسته بند بوسیله متون فارسی پیکره همشهری 2 موردآزمایش قرار داده شد. در این آزمایش 6 دسته مختلف از پیکره انتخاب شده بود که در این میان، برای دسته هایهنری، مذهبی، ورزشی و علمی دقت و بازخوانی یک بدست آمد که بهترین عملکرد ممکن می باشد و برای دستهپزشکی دقت 0.917 و بازخوانی یک و برای دسته رایانه بازخوانی 0.9 و دقت 1 بدست آمد.
Keywords:
Authors
شهریار زارع زاد
گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
احمد حبیبی زادنوین
گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
نیما جعفری زادنوین
گروه کامپیوتر، واحد علوم و تحقیقات آذربایجان شرقی، دانشگاه آزاد اسلامی، تبریز، ایران - گروه کامپیوتر، واحد تبریز، دانشگاه آزاد اسلامی، تبریز، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :