CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استخراج کلمات کلیدی فارسی با استفاده از تکنیکهای دادهکاوی

عنوان مقاله: استخراج کلمات کلیدی فارسی با استفاده از تکنیکهای دادهکاوی
شناسه ملی مقاله: COMCONF04_144
منتشر شده در چهارمین کنفرانس بین المللی مهندسی برق و کامپیوتر در سال 1395
مشخصات نویسندگان مقاله:

علی اصغر احمدی - گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی ، کرمانشاه، ایران.
مریم حبیبی - گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، واحد کرمانشاه، دانشگاه آزاد اسلامی ، کرمانشاه، ایران.

خلاصه مقاله:
با گسترش روزافزون متون فارسی و پشتیبانی اکثر نرمافزارها از زبان فارسی، روز به روز بر میزان تولید این اسناد افزوده میشود و همین مسیله نیاز به پردازشهایی بر روی متون دارد. استخراج کلمات کلیدی به عنوان یک تکنیک مهم برای بازگردانی اسناد، بازگردانی صفحات وب، خوشهبندی اسناد، خلاصهسازی متن، متنکاوی و موارد مشابه است. با استخراج کلمات کلیدی مناسب، میتوان بهراحتی اسناد را مطالعه کرده و رابطهی بین آنها را یافت. در این پژوهش با جمعآوری مجموعه اسنادی در حوزه رشته مهندسی کامپیوتر و انجام پیشپردازشی بر روی آنها ویژگیهایی همچون تعداد تکرار کلمات، شاخص پراکندگی کلمات و ... را استخراج کرده و در نهایت با استفاده از شبکه عصبی اقدام به استخراج کلمات کلیدی کرده که با به دست آوردن دقت 42,71 درصدی و صحت طبقهبندی 95 درصدی روش پیشنهادی از عملکرد قابل قبولی برخوردار بوده است.

کلمات کلیدی:
استخراج کلمات کلیدی، متنکاوی، دادهکاوی، شبکه عصبی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/609016/