بهبود دقت طبقهبندی اسناد با استفاده از ترکیب الگوریتمهای یادگیری ماشین
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 403
This Paper With 20 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF04_264
تاریخ نمایه سازی: 10 تیر 1396
Abstract:
باتوجه به داده های عظیم موجود درپایگاه های داده اینترنت و مراکزاطلاعاتی طبقه بندی متن یک نقش مهم درسازمان دهی بازیابی و جستجوی اطلاعات موجود دراین پایگاه های داده می باشد درواقع می توان گفت طبقه بندی متن اختصاص دادن یک متن به یک طبقه ازپیش تعیین شده می باشد برایاختصاص یافتن یک متن به یک طبقه خاص ازویژگیهای متن موجود استفاده میشود و باتوجه به ویژگیهای فراوانی که برای متون وجود دارد یک چالش اساسی انخاب زیرمجموعه ای ازویژگیهای مناسب برای یک متن می باشد ازاین رو دراین مقاله ازفیلترهای مختلفی جهت انتخاب ویژگی ازجمله حذف کلمات متوقف کننده n-gram و ... استفاده شده است دراین پژوهش ازمجموعه داده استاندارد خبرگزاری رویترز Reuters-21578 با8دسته مختلف و درمجموعه بیش از7000 سندمتنی استفاده شده است ازالگوریتم های ترکیبی جهت طبقه بندی استفاده کرده ایم که نتایج حاصل ازآزمایشها انجام شده برروی مجموعه داده نشان میدهد که الگوریتم پیشنهادی بهترین کارایی جهت طبقه بندی متن را داشته و باعث بهبود دقت و بازخوانی جهت طبقه بندی متن شده است باتوجه به نتایج شبیه سازی میزان دقت طبقه بندی اسناد برابر 96.66درصد شده است
Keywords:
Authors
حدیث شعیری
دانشجویی کارشناسی ارشد رشته نرم افزار، دانشگاه آزاد اسلامی واحد بروجرد
ابراهیم شیری
استادیار دانشکده ریاضی و علوم کامپیوتر دانشگاه صنعتی امیر کبیر
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :