بررسی اثر روابط بین خصیصه های سندها و دست هها در ضابط ههای روش های آماری انتخاب خصیصه در بهبود دسته بندی متون
Publish place: 11th Iranian Conference on Electric Engineering
Publish Year: 1382
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 944
This Paper With 10 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICEE11_037
تاریخ نمایه سازی: 18 تیر 1391
Abstract:
در دسته بندی متون، معمولا از کلمات یک تائی متون بعنوان خصیصه استفاده می شود. در این مقاله تاثیر استفاده از کلما ت دوتائی، روی کارائی الگوریتم های دسته بندی بررسی می شود. نتایج بدست آمده نشان می دهد استفاده از ترکیبات دوتا ئی کلمات در متون، اطلاعات ارزشمندی در رابطه با دسته بندی به مجموعه اطلاعات اولیه اسناد (کلمات یک تائی) اضافه می کند و به این طریق کارائی روش های دسته بندی افزایش می یابد. بنابراین استفاده از روش نمایش اسناد به صورت مجموعه ای از خصیصه های یک تائی و دوتائی می تواند بعنوان روشی مناسب جهت نمایش اسناد در دست هبندی متون استفاده گردد. همچنین با توجه به وجود تعداد بسیار زیاد خصیصه متنی، روش هائی نیز به منظور کاهش تعداد خصیص ه ها و انتخاب خصیصه های مرتبط، پیشنهاد شده است. اکثر روش های انتخاب خصیصه از دو رابطه مثبت و دو رابطه منفی بین خصیصه های سندها و دسته استفاده می کنند که در این مقاله با در نظر گرفتن کلیه روابط مثبت و منفی بین خصیصه های سندها و دسته ها در ضابط ههای انتخاب خصیصه، یکبار کلیه روابط مثبت و منفی را با اثر مثبت و بار دیگ ر روابط مثبت را با اثر مثبت و روابط منفی را با اثر منفی در ضابطه انتخاب خصیصه لحاظ می کند . ضمن ارزیابی های انجام گرفته روی مجموعه های داده ای رویتر و نیگام، ملاحظه می شود که کلیه روابط مثبت و منفی، نقش موثری را در تعیین دسته سندها دارند و همچنین بهتر بودن نتایج ضابطه دوم، نشان دهنده تاثیر بیشتر روابط مثبت، نسبت به روابط منفی م یباشد
Keywords:
Authors
سعید جلیلی
دانشگاه تربیت مدرس، دانشکده فنی و مهندسی، گروه کامپیوتر
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :