استخراج کلمات کلیدی فارسی با استفاده از تکنیکهای دادهکاوی
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,108
This Paper With 17 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF04_144
تاریخ نمایه سازی: 10 تیر 1396
Abstract:
با گسترش روزافزون متون فارسی و پشتیبانی اکثر نرمافزارها از زبان فارسی، روز به روز بر میزان تولید این اسناد افزوده میشود و همین مسیله نیاز به پردازشهایی بر روی متون دارد. استخراج کلمات کلیدی به عنوان یک تکنیک مهم برای بازگردانی اسناد، بازگردانی صفحات وب، خوشهبندی اسناد، خلاصهسازی متن، متنکاوی و موارد مشابه است. با استخراج کلمات کلیدی مناسب، میتوان بهراحتی اسناد را مطالعه کرده و رابطهی بین آنها را یافت. در این پژوهش با جمعآوری مجموعه اسنادی در حوزه رشته مهندسی کامپیوتر و انجام پیشپردازشی بر روی آنها ویژگیهایی همچون تعداد تکرار کلمات، شاخص پراکندگی کلمات و ... را استخراج کرده و در نهایت با استفاده از شبکه عصبی اقدام به استخراج کلمات کلیدی کرده که با به دست آوردن دقت 42,71 درصدی و صحت طبقهبندی 95 درصدی روش پیشنهادی از عملکرد قابل قبولی برخوردار بوده است.
Keywords:
Authors
علی اصغر احمدی
گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی ، کرمانشاه، ایران.
مریم حبیبی
گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی ، کرمانشاه، ایران.
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :