بهبود روش تشخیص سرقت ادبی با استفاده از روش متن کاوی

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,109

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

DSCONF02_177

تاریخ نمایه سازی: 21 شهریور 1395

Abstract:

سرقت ادبی به گونه های مختلف اعم از کپی کردن متن و اتخاذ ایده ، بدون نسبت دادن آن به مبتکرش می باشد. با ظهورکامپیوتر و گسترش روز افزون اینترنت، دسترسی به ایده ها، مقالات، مستندات و دست نوشته های دیگران آسان گردیده است. باتوجه به این موضوع و نیز اهمیت حفظ حقوق افراد در سالهای اخیر، پژوهشگران تحقیقاتی را جهت ارائه روشهایی برایتشخیص سرقت ادبی انجام داده اند. سرقت ادبی را می توان به چندین دسته طبقه بندی کرد این طبقه بندی ، درک عمیق ازالگوهای مختلف زبان شناسی در ارتکاب سرقت ادبی را پشتیبانی می کند مثل تغییر متن ها به معادل معنایی اما با واژه هایمختلف، کوتاه کردن متون با تعمیم مفهوم و مشخصات و اتخاذ ایده ها.در همین راستا در این تحقیق، بهبود روشی برای تشخیص سرقت ادبی پیشنهاد می شود. در این روش ابتدا پیش پردازشی بر رویاسناد انجام می دهیم و سپس الگوریتم اسمیز واترمن را برای ساخت ماتریس تطابق اعمال می کنیم. بعد از ساخت ماتریس سعیمی کنیم زیر رشته هایی که دارای اختلاف کمی هستند را با یکدیگر تلفیق کنیم و در ادامه به هر یک از جمله ها وزن می دهیم.مجموعه آزمایشات بر روی دیتا ست PAN13 انجام شده است و با چهار نفر برتر مسابقه کشف سرقت ادبی در سال 2013مقایسه می گردد و با توجه به نتایج بدست آمده کارایی بهتر الگوریتم پیشنهادی نسبت به چهار نفر برتر مسابقه نشان داده می شود.

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • H. A. Maurer, F. Kappe, and B. Zaka, "Plagiarism-A Survey., ...
  • Osman, A.H, Salim, N and Abuobied, A, "Survey of Text ...
  • E. Stamatatos, "Plagiarism detection using stopword n-grams, " J. Am. ...
  • M. Elhadi and A Al-Tobi, "Use of text syntactical structures ...
  • J. Agarwal, R. H. Goudar, P. Kumar, N. Sharma, V. ...
  • Y. Li, D. McLea, Z. Bandar, J. D. O'shea, K. ...
  • D. Gupta, K. Vani, and C. K. Singh, "Using Natural ...
  • E. Stamatatos, "Plagiarism detection based on structural information, " in ...
  • A. H. Osman, N. Salim, and A. A. E. Elhadi, ...
  • M. Chong, L. Specia, and R. Mitkov, "Using natural language ...
  • F. Sanchez-Vega, E. Villatoro-Tello, M. Montes-y- Gomez, L. Villasen or-Pineda, ...
  • Hartrumpf, A. S., Bruck, T., & Eichhorn, C. Semantic duplicate ...
  • Hoad, T. C., & Zobel, J. Methods for identifying versioned ...
  • Shivakumar, D. N., & Garcia-Molina. H. SCAM: A copy detection ...
  • Zechner, M., Muhr, M., Kern, R., & Granitzer, M. External ...
  • Yergeau, F., UTF-8, _ transformation format of ISO 10646. 2003. ...
  • Islam, A. and D. Inkpen, Semantic text similarity using corpus-based ...
  • Potthast, M., et al. Overview of the 5th international competition ...
  • نمایش کامل مراجع