CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

دسته بندی متون انگلیسی با استفاده از الگوریتم های درخت تصمیم،بگینگ

عنوان مقاله: دسته بندی متون انگلیسی با استفاده از الگوریتم های درخت تصمیم،بگینگ
شناسه ملی مقاله: ECDS09_011
منتشر شده در نهمین همایش ملی علوم و مهندسی دفاعی با محوریت فناوری های دانش بنیان دفاعی در سال 1401
مشخصات نویسندگان مقاله:

محسن نوروزی - دکتری کامپیوتر، دانشکده کامپیوتر، شبکه و ارتباطات، دانشگاه امام حسین (ع)، تهران، ایران
علی ارشقی - دکتری برق مخابرات، دانشکده کامپیوتر، شبکه و ارتباطات، دانشگاه امام حسین (ع)، تهران، ایران
جواد اسدی - دانشجوی دکتری سیستم های نرم افزاری، دانشکده کامپیوتر، دانشگاه آزاد اسلامی، قزوین، ایران

خلاصه مقاله:
با توجه به گسترش و توسعه سریع سایت های تجاری و رسانه های اجتماعی حجم زیادی از داده ها تولید می-شود . این حجم زیاد داده های تولید شده نیاز به سازماندهی مناسب دارد. به همین دلیل فرآیند متن کاویبرای استخراج ویژگیهای مرتبط و دانش از اسناد غیر ساخت یافته مورد استفاده قرار می گیرد. متن کاوی درواقع استخراج اطلاعات و دانش مفید از متون غیرساخت یافته است. حجم زیادی از اسناد و منابع در پایگاهاطلاعاتی الکترونیکی قرار دارند. برخی از این پایگاه های اطلاعاتی شامل اطلاعات با ارزش هستند که دانشانبوهی را در خود پنهان کرده اند . روش طبقه بندی اسناد در متن کاوی برای استخراج ویژگی های مرتبط مورداستفاده قرار می گیرد. در این روش با استفاده از داده های آموزشی مدلی ایجاد می شود و سپس داده های جدیدبه مدل ایجاد شده داده می شود و برچسب آنها پیش بینی می شود. الگوریتم های طبقه بندی زیادی برای زبانانگلیسی و زبان های دیگر وجود دارند. هر کدام از این الگوریتم ها برای بهبود شرایط طبقه بندی با گذشت زماندست خوش تغییرات و تکاملاتی شده اند. در این مقاله با ترکیب این الگوریتم ها سعی در بهبود طبقه بندیخواهیم داشت و نتایج حاصل را ارائه خواهیم کرد.

کلمات کلیدی:
متن کاوی، طبقه بندی، k نزدیکترین همسایه، درخت تصمیم، بگینگ

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1753334/