بازنمایی متن مبتنی بر بافت با استفاده از موضوعات پنهان برای دسته بندی مقالات علمی

Publish Year: 1402
نوع سند: مقاله ژورنالی
زبان: Persian
View: 48

This Paper With 29 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JLRZ-15-49_002

تاریخ نمایه سازی: 30 بهمن 1402

Abstract:

سالانه پژوهشگران حوزه های مختلف علمی نتایج پژوهش های خود را به صورت گزارش های فنی یا مقالات علمی در مجموعه مقالات یا مجلات منتشر می کنند. گردآوری این نوع داده توسط موتورهای جستجو و کتابخانه های دیجیتال برای جستجو و دسترسی به نشریات تحقیقاتی استفاده می شود که معمولا مقالات مرتبط براساس کلیدواژه های پرسمان به جای موضوعات مقاله بازیابی می گردد. در نتیجه، دسته بندی دقیق مقالات علمی می تواند کیفیت جستجوی کاربران را هنگام جستجوی یک سند علمی در پایگاه های اطلاعاتی افزایش دهد.هدف اصلی این مقاله، ارائه یک مدل دسته بندی برای تعیین موضوع مقالات علمی است. برای این منظور، مدلی را پیشنهاد کردیم که از دانش بافتی غنی شده مقالات فارسی مبتنی بر معناشناسی توزیعی استفاده می کند. بر این اساس، شناسایی حوزه خاص هر سند و تعیین دامنه آن توسط دانش غنی برجسته، دقت دسته بندی مقالات علمی را افزایش می دهد. برای رسیدن به هدف، ما مدل های درونه یابی بافتی، اعم از ParsBERT یا XLM-RoBERTa را با موضوعات پنهان در مقالات را برای آموزش یک مدل پرسپترون چندلایه غنی می کنیم. بر اساس نتایج تجربی، عملکرد کلی ParsBERT-NMF-۱HT ۷۲/۳۷ درصد (ماکرو) و ۷۵/۲۱ درصد (میکرو) بر اساس معیار اف بود که تفاوت عملکرد این مدل در مقایسه با مدل پایه از نظر آماری معنادار (p<۰.۰۵) بود.

Authors

مریم موسویان

دانشکده مهندسی کامپیوتر، دانشگاه صنعتی امیرکبیر

مسعود قیومی

پژوهشگاه علوم انسانی و مطالعات فرهنگی