ارائه یک روش ترکیبی برای دسته بندی متون فارسی بوسیله تکنیک رای گیری موازی
Publish place: The Second National Congress of New Technologies of Iran with the aim of achieving sustainable development
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 957
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SENACONF02_096
تاریخ نمایه سازی: 30 آبان 1394
Abstract:
بررسی ها و مطالعات نشان میدهند که روشهای دسته بندی متون مانند بیز ساده و ماشین بردار پشتیبان نمی توانند کیفیت دسته بندی را از یک حدی بیشتر افزایش دهند اما با بهره گیری از روش های ترکیبی، می توان کیفیت دسته بندی را ارتقا داد. روش های بیز ساده و الگوریتم درخت تصمیم در متون لاتین کارایی خوبی را از خود نشان داده اند. با توجه به پایگاه های اطلاعاتی و همچنین سایت های ثبت اسناد کشور این روشها در متون فارسی انجام نشده اند. در این پژوهش سعی خواهد شد تا یک مدل دسته بندی خودکار را با استفاده از ترکیبی از الگوریتم ها و تکنیک های متن کاوی بیز ساده و الگوریتم درخت تصمیم برای متون فارسی فراهم کنیم که بتوان با استفاده از این مدل، متون فارسی را به صورت خودکار باکار آیی و دقت بالا دسته بندی کرد. جهت بالا بردن کارایی نهایی دسته بندی اسناد متنی، هدف در این پژوهش استفاده از ترکیبی از دسته بندها بجای استفاده از یک دسته بند منفرد میباشد. نتایج نشان میدهد که استفاده از دسته بند ترکیبی عملکرد بهتری نسبت به دسته بندهای منفرد خواهد داشت.
Keywords:
Authors
عارف سیاحی
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سید محسن هاشمی
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سعید مزرعه
آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :