بازیابی و رتبه بندی افراد خبره با استفاده از مدل ترجمه مبتنی بر خوشه بندی

مهدی دهقان; احمدعلی آبین

بازیابی و رتبه بندی افراد خبره با استفاده از مدل ترجمه مبتنی بر خوشه بندی

Publish place: Tabriz Journal of Electrical Engineering، Vol: 49، Issue: 3

Publish Year: 1398

نوع سند: مقاله ژورنالی

زبان: Persian

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1697306

شناسه ملی سند علمی:

JR_TJEE-49-3_012

تاریخ نمایه سازی: 27 تیر 1402

Abstract:

استخراج دانش از میان داده های موجود در وب باتوجه به حجم و تنوع بالای آن به یک چالش در حوزه ی بازیابی اطلاعات تبدیل شده است. در این میان، مساله ی بازیابی و رتبه بندی افراد خبره با هدف بازیابی و رتبه بندی افراد خبره در زمینه ی موضوع پرس وجوی کاربر، به عنوان یکی از مهم ترین مسائل موجود در این حوزه توجه بسیاری از پژوهشگران را به خود جلب نموده است. مهم ترین چالش در مسئله ی بازیابی افراد خبره تشخیص میزان ارتباط بین کلمات پرس وجو و سند های نوشته شده توسط نامزد های خبرگی است. یک مشکل اساسی در این حوزه فاصله ی واژگانی میان کلمات پرس وجو و سند های نامزد های خبرگی است. در این مقاله دو مدل ترجمه ی جدید برای مدل سازی فاصله ی واژگانی ارائه شده است. مدل اول یک مدل احتمالاتی مبتنی بر خوشه بندی و مدل دوم مبتنی بر مدل سازی موضوعی است. در هر دو مدل، کلمات پرس وجو به مجموعه ای از کلمات مرتبط با پرس وجو که بیشتر نشان دهنده ی یک زمینه ی خبرگی هستند ترجمه شده است. پس از ترجمه ی کلمات، از یک مدل ترکیب کننده به منظور بازیابی استفاده شده است. مدل های ارائه شده بر روی مجموعه ی آزمون Stack Overflow ارزیابی و تحلیل شده است. نتایج به دست آمده بیانگر افزایش میانگین متوسط دقت روش ارائه شده در مقایسه با سایر روش های بازیابی افراد خبره است.

Keywords:

بازیابی افراد خبره , مدل ترجمه , خوشه بندی , مدل سازی موضوعی , فاصله ی واژگانی , سیستم های پاسخ به پرسش

Authors

مهدی دهقان

دانشکده مهندسی و علوم کامپیوتر - دانشگاه شهید بهشتی

احمدعلی آبین

دانشکده مهندسی و علوم کامپیوتر - دانشگاه شهید بهشتی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

مریم باسره، ولی درهمی و سجاد ظریف زاده، «ارائه ی ...
رضا خدایی، محمدعلی بالافر و سیدناصر رضوی، «اثربخشی بسط پرس ...
K. Balog, L. Azzopardi, and M. de Rijke. “A language ...
M. Karimzadehgan and Ch. Zhai, “Estimation of statistical translation models ...
H. Li, and J. Xu. “Semantic matching in search.” Foundations and ...
S. Momtazi, and F. Naumann. “Topic modeling for expert finding ...
C. Van Gysel, M. de Rijke, and M. Worring, “Unsupervised, ...
K. Balog, Y. Fang, M. de Rijke, P. Serdyukov, and ...
C. Macdonald, and I. Ounis. ‘’Voting for candidates: adapting data ...
M. Zhang, R. Song, C. Lin, S. Ma, Z. Jiang, ...
Y. Cao, J. Liu, S. Bao, and H. Li. “Research ...
R. M. Cooke, S. ElSaadany, and X. Huang. “On the ...
C. D. Manning and H. Schütze, “Foundations of statistical natural language ...
T. Mueller-Prothmann and I. Finke, “SELaKT-Social Network Analysis as a ...
D. M. Blei, A. Y. Ng and M. I. Jordan, ...
Gerard. Salton, A. Wong and C. Yang, “A vector space ...
C. Van Gysel, M. de Rijke, and M. Worring. “Unsupervised, ...
S. Patil, and K. Lee. “Detecting experts on Quora: by ...
A. Dargahi Nobari, S. Sotudeh Gharebagh and M. Neshati, “Skill ...
A. Berger and J. Lafferty, “Information retrieval as statistical translation.”, ...
R. Jin, A. G. Hauptmann and C. Zhai, “Language model ...
V. Lavrenko, M. Choquette and W. B. Croft, “Cross-lingual relevance ...
J. Nie, M. Simard, P. Isabelle and R. Durand, “Cross-language ...
J. Xu, R.Weischedel and C. Nguyen, “Evaluating a probabilistic model ...
V. Murdock and W. B. Croft, “Simple translation models for ...
D. van Dijk, M. Tsagkias and M. de Rijke, “Early ...
V. Dimitrova, T. Kuflik, D. Chin, F. Ricci, P. Dolog, ...

نمایش کامل مراجع