پیشنهاد یک روش K نزدیکترین همسایه برای دسته بندی اسنادمتنی
عنوان مقاله: پیشنهاد یک روش K نزدیکترین همسایه برای دسته بندی اسنادمتنی
شناسه ملی مقاله: BPJ01_188
منتشر شده در اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات در سال 1392
شناسه ملی مقاله: BPJ01_188
منتشر شده در اولین همایش ملی رویکردهای نوین در مهندسی کامپیوتر و بازیابی اطلاعات در سال 1392
مشخصات نویسندگان مقاله:
فاطمه شیخی - کارشناسی ارشدنرم افزار
لاله الله دادی - دانشجوی کارشناسی ارشدنرم افزار
مائده عابدینی بقاء - دانشجوی کارشناسی ارشد
خلاصه مقاله:
فاطمه شیخی - کارشناسی ارشدنرم افزار
لاله الله دادی - دانشجوی کارشناسی ارشدنرم افزار
مائده عابدینی بقاء - دانشجوی کارشناسی ارشد
دراین مقاله به دسته بندی اسنادمتنی حجیم پرداخته شدها ست روش پیشنهادی به کاربردن درهم سازکمینه به همراه دسته بندK نزدیکترین همسایه بااستفاده ازیک روش انتخاب ویژگی مبتنی برروش بیزساده می باشد تابع درهم سازکمینه معمولا برای سرعت بخشیدن درجستجوی جداول فشرده سازی داده ها و تشخیص رکوردهای تکراری درحجم زیادداده استفاده میشود امادراین مقاله برای خلاصه کردن اسناد متنی به کارگرفته شده است استفاده ازدرهمساز کمینه به همراه یک دسته بندبصورت طبیعی با افت دقت همراه است اما درعین حال باعث بالا رفتن سرعت عملیات دسته بندی میشود دراینجا برای حل مشکل افت دقت حاصل ازدرهمساز کمینه یک دسته بندK نزدیکترین همسایه پیشنهاد شده که درآن به جای درنظرگرفتن شباهت کسینوسی بین اسناد ازشباهت جاکارد استفاده شده است این دسته بند برروی 500 سندانتخابی ازبین 2000سند موجود درانتقادات راجع به فیلم پیاده سازی شده که 400سند برای اموزش و100سند برای ازمایش درنظرگرفته شدها ست نتایج پیاده سازی نشان میدهد که دسته بندپیشنهادی K نزدیکترین همسایه نسبت به K نزدیکترین همسایه ی معمولی درعین داشتن سرعت بالاتر میزان دقت آ« را نیز بهبود بخشیده است
کلمات کلیدی: دسته بندی اسنادمتنی، درهم سازکمینه، Kنزدیکترین همسایه و تشابه جاکارد
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/225454/