دسته بندی سوالات Stack Overflow با استفاده از بازنمایی های سنتی و جدید

حسین پاکروح; حسین عباسی مهر

دسته بندی سوالات Stack Overflow با استفاده از بازنمایی های سنتی و جدید

Publish place: 6th National Conference on Distributed Computing and Big Data Processing

Publish Year: 1399

نوع سند: مقاله کنفرانسی

زبان: Persian

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1167813

شناسه ملی سند علمی:

DCBDP06_026

تاریخ نمایه سازی: 25 اسفند 1399

Abstract:

برچسب گذاری خودکار سوالات زبان های برنامه نویسی نقش مهمی در مرتبط کردن سوالات با پاسخ دهندگان در یک پلتفرم پرسش و پاسخ دارد. دسته بندی سوالات با استفاده از متن سوال و با بكارگيری روش های یادگيری ماشين یكی از روش های مورد استفاده در این زمينه است. با توجه به اینكه در دسته بندی سوالات بازنمایی متن نقش ویژه ای در عملكرد دسته بند دارد، در این مقاله بازنماییسنتی مبتنی بر مدل n-grams به همراه فرکانس کلمه -معكوس فرکانس سند با بازنمایی جدید مبتنی بر روش های یادگيری عميق مورد مقایسه قرار گرفت. پس از انجام پيش پردازش و ساخت بردارهای ورودی، دسته بندهای بيز ساده، رگراسيون لجستيک، ماشين بردار پشتيبان و K نزدیكترین همسایه روی مجموعه ای از سوالات سایت Stack Overflow اعمال گردید. همچنين یک تكنيکمبتنی بر حافظه طولانی کوتا ه-مدت پياده سازی گردید. نتایج روی داده های مورد استفاده در این مقاله نشان می دهد که مدل های مبتنی بر بازنمایی سنتی دقت بهتری نسبت به بازنمایی مبتنی بر یادگيری عميق دارند.

Keywords:

دسته بندی سوالات , یادگیری ماشین , بازنمایی مبتنی بر مدل n-grams , بازنمایی مبتنی بر یادگیری عمیق

Authors

حسین پاکروح

دانشکده فناوری اطلاعات و مهندسی کامپیوتر، دانشگاه شهید مدنی آذربایجان، تبریز

حسین عباسی مهر

دانشکده فناوری اطلاعات و مهندسی کامپیوتر، دانشگاه شهید مدنی آذربایجان، تبریز