تشخیص سرقت علمی در متون بازنویسی شده براساس شاخص گذاری با استفاده از شبكه واژگان فارسی

میلاد سرانجام; وحید رستمی

تشخیص سرقت علمی در متون بازنویسی شده براساس شاخص گذاری با استفاده از شبكه واژگان فارسی

Publish place: 4th International Conference on Interdisciplinary Researches in Electrical, Computer, Mechanical and Mechatronics Engineering in Iran and Islamic World

Publish Year: 1399

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 13 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1184161

شناسه ملی سند علمی:

ECMM04_045

تاریخ نمایه سازی: 1 اردیبهشت 1400

Abstract:

گسترش روز افزون اینترنت، دسترسی به ایده ها، مقالات، مستندات و دست نوشته های دیگران آسان تر گردیدهاین امر موجب تبادل سریع اطلاعات و در مقابل، سبب آسان تر شدن سرقت ادبی یا Plagiarism شدهاست. عموماً روش های اندازه گیری تشابه متن مبتنی بر بردار تکرار واژه، روابط معنایی بین کلمات را نادیدهمی گیرند، که در واقع مانعی برای محاسبه شباهت متن، در ابعاد بالا و پراکندگی بیشتر بردار سند می باشد. برایغلبه بر این مشکلات، از تجزیه مقادیر منفرد (SVD) برای کاهش ابعاد و حذف نویزهای مدل ارائه متن استفادهمی شود. مقدار بهینه مقادیر منفرد محاسبه می شود و ارتباط معنایی بین کلمات را می توان در فضای معناییساخته شده محاسبه کرد. در این پژوهش یک الگوریتم ساخت شاخص معکوس (TF-IDF) و تعاریف مشابه بینبردارها برای محاسبه شباهت بین دو سند در سطح معنایی پیشنهاد شده است. جهت ارزیابی کارائی الگوریتم، ازمجموعه داده مسابقات plagdet2016 مرکز تحقیقات مخابرات ایران استفاده شده است. در ادامه، نتایج تجربیدر مورد مجموعه ی متنی مورد ارزیابی شده نشان می دهد که الگوریتم پیشنهادی معیارهای ارزیابی کارایی مانند را افزایش می دهد.

Keywords:

سرقت متن , ارتباط معنایی , تجزیه مقادیر منفرد , اندازه گیری تشابه متن , LSA

Authors

میلاد سرانجام

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران

وحید رستمی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران