دسته بندی سوالات Stack Overflow با استفاده از بازنمایی های سنتی و جدید

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 241

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

DCBDP06_026

تاریخ نمایه سازی: 25 اسفند 1399

Abstract:

برچسب گذاری خودکار سوالات زبان های برنامه نویسی نقش مهمی در مرتبط کردن سوالات با پاسخ دهندگان در یک پلتفرم پرسش و پاسخ دارد. دسته بندی سوالات با استفاده از متن سوال و با بكارگيری روش های یادگيری ماشين یكی از روش های مورد استفاده در این زمينه است. با توجه به اینكه در دسته بندی سوالات بازنمایی متن نقش ویژه ای در عملكرد دسته بند دارد، در این مقاله بازنماییسنتی مبتنی بر مدل n-grams به همراه فرکانس کلمه -معكوس فرکانس سند با بازنمایی جدید مبتنی بر روش های یادگيری عميق مورد مقایسه قرار گرفت. پس از انجام پيش پردازش و ساخت بردارهای ورودی، دسته بندهای بيز ساده، رگراسيون لجستيک، ماشين بردار پشتيبان و K نزدیكترین همسایه روی مجموعه ای از سوالات سایت Stack Overflow اعمال گردید. همچنين یک تكنيکمبتنی بر حافظه طولانی کوتا ه-مدت پياده سازی گردید. نتایج روی داده های مورد استفاده در این مقاله نشان می دهد که مدل های مبتنی بر بازنمایی سنتی دقت بهتری نسبت به بازنمایی مبتنی بر یادگيری عميق دارند.

Keywords:

دسته بندی سوالات , یادگیری ماشین , بازنمایی مبتنی بر مدل n-grams , بازنمایی مبتنی بر یادگیری عمیق

Authors

حسین پاکروح

دانشکده فناوری اطلاعات و مهندسی کامپیوتر، دانشگاه شهید مدنی آذربایجان، تبریز

حسین عباسی مهر

دانشکده فناوری اطلاعات و مهندسی کامپیوتر، دانشگاه شهید مدنی آذربایجان، تبریز