ارائه یک روش جدید در فاز آماده سازی داده های آموزشی دسته بندی سلسله مراتبی برای دسته بندی متون فارسی

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,034

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CEIT01_498

تاریخ نمایه سازی: 9 تیر 1393

Abstract:

امروزه حجم انبوهی از اطلاعات در قالب اسناد ذخیره می شوند. دسته بندی متون فرآیندی است که در آن، متن ها به یک یا چند دسته از قبل تعریف شده تقسیم می شوند. در بسیاری از موارد، دسته هایی که باید تشخیص داده شوند از یک ساختار سلسله مراتبی برخوردار بوده و شامل تعداد زیادی دسته می باشند. از جمله مشکلات روش دسته بندی سلسله مراتبی داده های آموزشی نامتعادل ( جایی که سندهای منفی بیشتر از سندهای مثبت هستند) می باشند. همچنین در اغلب کارهای انجام شده روی دسته بندی سلسله مراتبی محدودیت هایی اعمال شده است. به عنوان مثال ارتباط دسته ها به صورت درخت در نظر گرفته شده است( نمی تواند گراف بدون دور جهت دار DAG باش) ، یا یک مثال (سند) حتماً باید در گره های برگ متوقف شود( نمی تواند در هر گرهی از هر کدام از سطوح سلسله مراتب متوقف شود) و یا هر مثال باید به یک کلاس تعلق داشته باشد (نمی تواند همزمان به بیش از یک کلاس تعلق داشته باشد) . در این مقاله یک روش جدید برای فاز آماده سازی داده های آموزشی در روش دسته بندی سلسله مراتبی محلی ارائه شده است که محدودیت های فوق را نداشته و سعی در رفع مشکل داده های آموزشی نامتعادل کرده است. نتایج حاصل از آزمایشات انجام شده نشان دهنده دقت و F1 در روش پیشنهادی می باشد.

Keywords:

دسته بندی سلسله مراتبی , دسته بندی محلی , فازآماده سازی داده های آموزشی , DAG , پیش بینی غیر اجباری گره برگ

Authors

مهسا مومنی

دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان، گروه مهندسی کامپیوتر، اهواز، ایران

محمد حسین یکتایی

استادریار دانشگاه آزاد اسلامی واحد آبادان گروه مهندسی کامپیوتر، آبادان ، ایران

ماشاالله عباسی دزفولی

استادیار دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان گروه مهندسی کامپیوتر، اهواز، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :