CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک روش ترکیبی برای دسته بندی متون فارسی بوسیله تکنیک رای گیری موازی

عنوان مقاله: ارائه یک روش ترکیبی برای دسته بندی متون فارسی بوسیله تکنیک رای گیری موازی
شناسه ملی مقاله: SENACONF02_096
منتشر شده در دومین کنگره سراسری فناوریهای نوین ایران با هدف دستیابی به توسعه پایدار در سال 1394
مشخصات نویسندگان مقاله:

عارف سیاحی - آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سید محسن هاشمی - آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران
سعید مزرعه - آموزشکده فنی و حرفه ای سما،دانشگاه آزاد اسلامی واحد سوسنگرد، سوسنگرد، ایران

خلاصه مقاله:
بررسی ها و مطالعات نشان میدهند که روشهای دسته بندی متون مانند بیز ساده و ماشین بردار پشتیبان نمی توانند کیفیت دسته بندی را از یک حدی بیشتر افزایش دهند اما با بهره گیری از روش های ترکیبی، می توان کیفیت دسته بندی را ارتقا داد. روش های بیز ساده و الگوریتم درخت تصمیم در متون لاتین کارایی خوبی را از خود نشان داده اند. با توجه به پایگاه های اطلاعاتی و همچنین سایت های ثبت اسناد کشور این روشها در متون فارسی انجام نشده اند. در این پژوهش سعی خواهد شد تا یک مدل دسته بندی خودکار را با استفاده از ترکیبی از الگوریتم ها و تکنیک های متن کاوی بیز ساده و الگوریتم درخت تصمیم برای متون فارسی فراهم کنیم که بتوان با استفاده از این مدل، متون فارسی را به صورت خودکار باکار آیی و دقت بالا دسته بندی کرد. جهت بالا بردن کارایی نهایی دسته بندی اسناد متنی، هدف در این پژوهش استفاده از ترکیبی از دسته بندها بجای استفاده از یک دسته بند منفرد میباشد. نتایج نشان میدهد که استفاده از دسته بند ترکیبی عملکرد بهتری نسبت به دسته بندهای منفرد خواهد داشت.

کلمات کلیدی:
متن ، متن کاوی ، روش ترکیبی ، رای گیری

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/399586/