ارائه یک روش ترکیبی جهت بهبود افزایش دقت دسته بندی اسناد علمی با استفاده از الگوریتم KNN و تکنیک شاخص گذاری معنایی پنهان
Publish Year: 1394
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 890
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NICE01_030
تاریخ نمایه سازی: 30 دی 1394
Abstract:
در سال های اخیر الگوریتم های زیادی برای مساله دسته بندی اسناد، پیشنهاد شده است که از استراتژی های گوناگونی که اکثراً بر مبنای روش های باناظر می باشند، الگو گرفته اند. در واقع روش های زیادی جهت دسته بندی کردن اسناد ارائه شده اند که بدون توجه به مفاهیم نهفته درون متن، عملیات دسته بندی را انجام می دهند. تکنیک پیشنهادی ما در این مقاله این است ابتدا کلمات مهم و پرتکرار از متن اسناد علمی با استفاده از تکنیک TF-IDF بدست آمده و سپس با مقایسه با مفاهیم و کلمات کلیدی درخت سلسله مراتبی از رشته کامپیوتر، بتوان حوزه های کاری اسناد را بدست آورد و در نهایت با استفاده از یکی از تکنیک های پر کاربرد به نام LSI، از بین حوزه های تشخیص داده شده، بتوان دسته بندی را به طور تخصیص برای هر کدام از اسناد علمی انجام داد. در نهایت با استفاده از الگوریتم KNN، کار دسته بندی را انجام داد.
Keywords:
Authors
محمد کافیان
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد نجف آباد
مهدی باطنی
استادیار گروه مهندسی کامپیوتر، دانشگاه شیخ بهایی اصفهان
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :