مقایسه ی روشهای وزن دهی ویژگی درفرآیند طبقه بندی مستندات
Publish place: First National Conference on Advances in computer science and information retrieval approaches
Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,586
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
BPJ01_447
تاریخ نمایه سازی: 29 دی 1392
Abstract:
محوری ترین موضوع درحوزه متن کاوی طبقه بندی مستندات است اساس کارطبقه بندی مستندات برپایه کلمات کلیدی ومهمی است که ازمستندات استخراج میشود این کلمات یاهمان ویژگیها مضمون اصلی مطلب رابه مخاطب می رسانند ویانکات اصلی مطلب رابرمیگیرند بعدازاین مرحله فرایند وزن دهی به ویژگیها است وزن هرویژگی نشان دهنده قدرت ویژگی دربیان مفهوم کلی یک مستند است این دومرحله جز تکنیکهای پیش پردازش درحوزه طبقه بندی مستندات به شمار میرود بدیهی است انتخاب روشهای کارامد درشناسایی استخراج ووزن دهی ویژگی نقش مهمی دربالا بردن کارایی و دقت طبقه بندی کننده مستندات است درروشهای انتخاب ویژگی مواردی همچون میزان وابستگی ویژگی به مستندات تعدادتکرار ویژگی قدرت ویژگی درجداسازی مستندات و وابستگی ویژگیها به طبقات مورد بررسی قرارمیگیرد همچنین درموضوع وزن دهی روشهای مبتنی برتعدادتکرار کلمه IF روشهای مبتنی برتعدادتکرار کلمه درمستندات مختلف IDF,روشهای ترکیبی IDF,TF مطرح هستند بعدازمقایسه ی روشهای مطرح وزن دهی معلوم شد برخی ازآنها دربرابر افزیاش تعدادمستندات افزایش طول مستندات افزایش تعدادویژگیها افزایش طبقات و یاناهمگونی ماهیت ویژگیها درعملکرد و دقت دچار ضعف میشوند
Keywords:
Authors
مصطفی کریمی منش
دانشگاه پیام نورمرکزتهران
حسین شیرازی
دانشیاردانشگاه صنعتی مالک اشترتهران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :