ارائه یک روش جدید انتخاب ویژگی ترکیبی برای دسته بندی متون با استفاده از روش های یادگیری ماشین

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 453

This Paper With 18 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICOCS04_048

تاریخ نمایه سازی: 25 فروردین 1400

Abstract:

با رشد و توسعه سریع اینترنت، اطلاعات متنی بسیاری به شکل قابل خواندن توسط کامپیوتر ظهور یافته و به صورت نمایی در حال افزایش است. داده و منبع اینترنت به شکل کاملاً انبوه می باشد. برای اینکه به صورت بهینه از این مقدار داده اسناد زیاد، استفاده و آنها را مدیریت نمود، متن کاوی و بازیابی اطلاعات مبتنی بر محتوا به موضوعی داغ در حوزه مطالعاتی دنیا تبدیل شده است. دسته بندی متن یک پایه و اساس مهم برای بازیابی اطلاعات و متن کاوی می باشد. هدف اصلی این است که سند متنی بر اساس محتوا و نمونه های یادگیری برچسب دار به یک یا چند دسته بندی از پیش تعریف شده، منسوب شود. با افزایش تعداد اسناد دیجیتال موجود در اینترنت در سال های اخیر، امکان کار دستی بر روی چنین اطلاعات حجیمی وجود ندارد. روز به روز متدهای بیشتری بر اساس نظریه آماری و یادگیری ماشین به پردازش اطلاعات خودکار اعمال شده است. دسته بندهای مورد استفاده در این مقاله، نایوبیز چندجمله ای، نایوبیز چندجمله ای با عامل جداکننده، ماشین بردار پشتیبان، شبکه عصبی پس انتشار، K نزدیک ترین همسایه، درخت تصمیم و جنگل تصادفی هستند که به همراه روش های انتخاب ویژگی مربع کای و رپر استفاده می شوند. پیاده سازی روش پیشنهادی با استفاده از نرم افزار وکا انجام شده است. نتایج نشان دهنده بهبود معیار صحت روش پیشنهادی نسبت به سایر روش های پیشین می باشد.

Authors

فاطمه زیرک

گروه مهندسی کامپیوتر، واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران،