تشخیص سرقت علمی در متون بازنویسی شده براساس شاخص گذاری با استفاده از شبكه واژگان فارسی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 497

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ECMM04_045

تاریخ نمایه سازی: 1 اردیبهشت 1400

Abstract:

گسترش روز افزون اینترنت، دسترسی به ایده ها، مقالات، مستندات و دست نوشته های دیگران آسان تر گردیدهاین امر موجب تبادل سریع اطلاعات و در مقابل، سبب آسان تر شدن سرقت ادبی یا Plagiarism شدهاست. عموماً روش های اندازه گیری تشابه متن مبتنی بر بردار تکرار واژه، روابط معنایی بین کلمات را نادیدهمی گیرند، که در واقع مانعی برای محاسبه شباهت متن، در ابعاد بالا و پراکندگی بیشتر بردار سند می باشد. برایغلبه بر این مشکلات، از تجزیه مقادیر منفرد (SVD) برای کاهش ابعاد و حذف نویزهای مدل ارائه متن استفادهمی شود. مقدار بهینه مقادیر منفرد محاسبه می شود و ارتباط معنایی بین کلمات را می توان در فضای معناییساخته شده محاسبه کرد. در این پژوهش یک الگوریتم ساخت شاخص معکوس (TF-IDF) و تعاریف مشابه بینبردارها برای محاسبه شباهت بین دو سند در سطح معنایی پیشنهاد شده است. جهت ارزیابی کارائی الگوریتم، ازمجموعه داده مسابقات plagdet2016 مرکز تحقیقات مخابرات ایران استفاده شده است. در ادامه، نتایج تجربیدر مورد مجموعه ی متنی مورد ارزیابی شده نشان می دهد که الگوریتم پیشنهادی معیارهای ارزیابی کارایی مانند را افزایش می دهد.

Keywords:

Authors

میلاد سرانجام

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران

وحید رستمی

دانشکده مهندسی کامپیوتر و فناوری اطلاعات، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران