طبقه بندی متن بر اساس رویکرد ترکیبی از تجزیه مقادیر منفرد و ماشین برادر پشتیبان

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 305

This Paper With 5 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ETECH05_005

تاریخ نمایه سازی: 11 اردیبهشت 1400

Abstract:

در طبقه بندی متن هدف این است که سندهایی را که دراختیار داریم بتوانیم برچسب گذاری موضوعی کنیم. در واقع این موضوعصرفا یک مسئله باناظر است، یعنی مجموعه ای از اسناد متنی که گروه بندیموضوعی شده اند به عنوان داده ی آموزشی در اختیار سامانه قرار می گیرد تابتواند با یادگیری از این مجموعه، اسناد جدید ورودی را به یکی از اینگروه های موضوعی ملحق نماید. در طبقه بندی متن معمولا از کلمات متن بهعنوان ویژگی های آن متن استفاده می شود در نتیجه مسئله طبقه بندی متنبا تعداد بالایی از ویژگی ها مواجه می باشند. در این پژوهش از روش ماشینبرادر پشتیبان برای طبقه بندی متنها و تجزیه مقادیر منفرد برای انتخابویژگی های متن استفاده شده تا بتوان طبقه بندی متن را با کیفیت بالاتری بهانجام رساند. برای سنجش نتایج حاصله از مقایسه روش ما با دو روش دیگرمبتنی بر KNN و Naive Bayes استفاده شده است. در نتایجآزمایشگاهی مشاهده شد که روش پیشنهادی به طور میانگین از هر دو روشبهتر است.

Authors

سینا دامی

استادیار گروه مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

نجمه فرقانی

دانشجوی کارشناسی ارشد IT ، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران