دسته بندی متون انگلیسی با استفاده از الگوریتم های درخت تصمیم،بگینگ

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 66

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ECDS09_011

تاریخ نمایه سازی: 14 شهریور 1402

Abstract:

با توجه به گسترش و توسعه سریع سایت های تجاری و رسانه های اجتماعی حجم زیادی از داده ها تولید می-شود . این حجم زیاد داده های تولید شده نیاز به سازماندهی مناسب دارد. به همین دلیل فرآیند متن کاویبرای استخراج ویژگیهای مرتبط و دانش از اسناد غیر ساخت یافته مورد استفاده قرار می گیرد. متن کاوی درواقع استخراج اطلاعات و دانش مفید از متون غیرساخت یافته است. حجم زیادی از اسناد و منابع در پایگاهاطلاعاتی الکترونیکی قرار دارند. برخی از این پایگاه های اطلاعاتی شامل اطلاعات با ارزش هستند که دانشانبوهی را در خود پنهان کرده اند . روش طبقه بندی اسناد در متن کاوی برای استخراج ویژگی های مرتبط مورداستفاده قرار می گیرد. در این روش با استفاده از داده های آموزشی مدلی ایجاد می شود و سپس داده های جدیدبه مدل ایجاد شده داده می شود و برچسب آنها پیش بینی می شود. الگوریتم های طبقه بندی زیادی برای زبانانگلیسی و زبان های دیگر وجود دارند. هر کدام از این الگوریتم ها برای بهبود شرایط طبقه بندی با گذشت زماندست خوش تغییرات و تکاملاتی شده اند. در این مقاله با ترکیب این الگوریتم ها سعی در بهبود طبقه بندیخواهیم داشت و نتایج حاصل را ارائه خواهیم کرد.

Authors

محسن نوروزی

دکتری کامپیوتر، دانشکده کامپیوتر، شبکه و ارتباطات، دانشگاه امام حسین (ع)، تهران، ایران

علی ارشقی

دکتری برق مخابرات، دانشکده کامپیوتر، شبکه و ارتباطات، دانشگاه امام حسین (ع)، تهران، ایران

جواد اسدی

دانشجوی دکتری سیستم های نرم افزاری، دانشکده کامپیوتر، دانشگاه آزاد اسلامی، قزوین، ایران