الگوریتمی جدید برای طبقه بندی مستندات، مبتنی بر وزن دهی به ویژگی ها و فایل ها
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 427
This Paper With 10 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
SASTECH10_053
تاریخ نمایه سازی: 29 اردیبهشت 1398
Abstract:
با توجه به حجم روزافزون اطلاعات در دنیای کنونی، نیاز به ابزارهای قدرتمند جدید برای تبدیل داده به دانش مفید افزایش یافته است. یکی از روش های حیاتی کنترل و مدیریت داده ها، طبقه بندی متون میباشد. در این مقاله الگوریتمی برای طبقه بندی مستندات ارایه شده است، که دارای قابلیت هایی همچون کنترل کیفیت دسته بندی ایجاد شده براساس بازخورد معیار ارزیابی F؛ وزندهی به ویژگی ها با روش وزن دهی مبتنی بر طبقات و همچنین اختصاص دادن وزن به هر فایل در تمامی طبقات و انتقال فایل به طبقه ای که وزن بیشتری در آن طبقه دارد؛ میباشد. این روند باعث میشود حذف کلمات زاید به دلیل بهبود در کلاس ها با کیفیت بالاتری انجام شود. درنهایت الگوریتم را مورد ارزیابی قرار میدهیم؛ به این صورت که ابتدا تاثیر طبقه بندی تصادفی اولیه ی متفاوت، سپس تاثیر روش های مختلف وزندهیTFIDF،TFRF،TFCRF و روش وزندهی پیشنهادی را بر روی خروجی الگوریتم طبقه بندی پیشنهادی مورد بررسی قرار میدهیم. در پایان، الگوریتم پیشنهادی با سایر الگوریتم ها مقایسه میشود. نتایج نشان میدهد، تمامی موارد ذکر شده به صورت تجمعی باعث افزایش کیفیت و دقت در طبقه بندی میشود.
Keywords:
Authors
محبوبه ضیایی
کارشناسی ارشد هوش مصنوعی ، بخش مهندسی کامپیوتر،دانشگاه شهید باهنر کرمان
علی اکبر نیک نفس
استادیار ،بخش مهندسی کامپیوتر،دانشگاه شهید باهنر کرمان