الگوریتمی جدید برای طبقه بندی مستندات، مبتنی بر وزن دهی به ویژگی ها و فایل ها
Publish place: Computer engineering and need-based research The latest achievements in information technology
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 601
This Paper With 10 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMPUTER02_072
تاریخ نمایه سازی: 2 تیر 1395
Abstract:
با توجه به حجم روز افزون اطلاعات در دنیای کنونی، نیاز به ابزارهای قدرتمند جدید برای تبدیل داده به دانش مفید افزایش یافته است. یکی از روش های حیاتی کنترل و مدیریت داده ها، طبقه بندی متون می باشد. در این مقاله الگوریتمی برای طبقه بندی مستندات ارائه شده است که دارای قابلیت هایی همچون کنترل کیفیت دسته بندی ایجاد شده بر اساس بازخورد معیار ارزیابی F، وزن دهی به ویژگی ها با روش وزن دهی مبتنی بر طبقات و همچنین اختصاص دادن وزن به هر فایل در تمامی طبقات و انتقال فایل به طبقه ای که وزن بیشتری در آن طبقه دارد، می باشد. این روند باعی می شود حذف کلمات زائد به دلیل بهبود در کلاس ها با کیفیت بالاتری انجام شود. در نهایت الگوریتم را مورد ارزیابی قرار می دهیم، به این صورت که ابتدا تأثیر طبقه بندی تصادفی اولیه ی متفاوت، سپس تأثیر روش های مختلف وزن دهی TFCRF, TFRF, TFIDF و روش وزن دهی پیشنهادی را بر روی خروجی الگوریتم طبقه بندی پیشنهادی مورد بررسی قرار می دهیم. در پایان، الگوریتم پیشنهادی با سایر الگوریتم ها مقایسه می شود. نتایج نشان می دهد، تمامی موارد ذکر شده به صورت تجمعی باعث افزایش کیفیت و دقت در طبقه بندی می شود.
Keywords:
Authors
محبوبه ضیایی
آموزشکده فنی و حرفه ای سما، دانشگاه آزاد اسلامی، واحد کازرون، کازرون، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :