خوشه بندی متون کوتاه با یادگیری عمیق ویژگی
Publish place: کنفرانس ملی پژوهش های نوین در برق، کامپیوتر و مهندسی پزشکی
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,175
This Paper With 7 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
KAUCEE01_219
تاریخ نمایه سازی: 29 مهر 1396
Abstract:
با توجه به محبوبیت روزافزون و افزایش تعامل کاربران رسانه های اجتماعی از طریق متون کوتاه محاوره ای، خوشه بندی این نوع متون به یک وظیفه مهم تبدیل شده است. خوشه بندی متون کوتاه متفاوت از خوشه بندی متون رایج، به دلیل تنک بودن بازنمایی متن در آن به یک مشکل چالش برانگیز تبدیل شده است. در این مقاله، یک روش خوشه بندی متون کوتاه از طریق یادگیری عمیق با شبکه عصبی پیجیده پویا DCNN پیشنهاد شده است. روش پیشنهادی، با اعمال یک محدودیت در ویژگی های یادگیرنده از طریق یک چارچوب یادگیری خودآموز بدون استفاده از برچسب خارجی سودمند عمل می کند. نخست، ویژگی های کلیدی اصلی در کدهای باینری فشرده با حفظ محدودیت های محلی تعبیه می شوند. سپس، تعبیه کلمات برای یادگیری ویژگی های عمیق با واحدهای خروجی مطابق با کد دودویی از پیش آموزش دیده شده در فرایند یادگیری بررسی شده و به شبکه های عصبی پیچیده منتقلمی شوند. درنهایت، این بازنمایی از ویژگی های عمیق با استفاده از الگوریتم k میانگین خوشه بندی می شوند. نتایج ارزیابی برروی مجموعه داده های پرسش TREC و DBpedia نشان از برتری روش بازنمایی پیشنهادی در مقایسه با سایر روش های بازنمایی متون کوتاه دارد.
Keywords:
Authors
سینا دامی
استادیار، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران
مصطفی هاشمی
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران