بهبود روش تشخیص سرقت ادبی با استفاده از روش متن کاوی

عمار توکلی; مرضیه احمدزاده; رضا اکبری

بهبود روش تشخیص سرقت ادبی با استفاده از روش متن کاوی

Publish place: The Second International Conference on New Findings in Science and Technology

Publish Year: 1395

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 11 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > متن کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/507469

شناسه ملی سند علمی:

DSCONF02_177

تاریخ نمایه سازی: 21 شهریور 1395

Abstract:

سرقت ادبی به گونه های مختلف اعم از کپی کردن متن و اتخاذ ایده ، بدون نسبت دادن آن به مبتکرش می باشد. با ظهورکامپیوتر و گسترش روز افزون اینترنت، دسترسی به ایده ها، مقالات، مستندات و دست نوشته های دیگران آسان گردیده است. باتوجه به این موضوع و نیز اهمیت حفظ حقوق افراد در سالهای اخیر، پژوهشگران تحقیقاتی را جهت ارائه روشهایی برایتشخیص سرقت ادبی انجام داده اند. سرقت ادبی را می توان به چندین دسته طبقه بندی کرد این طبقه بندی ، درک عمیق ازالگوهای مختلف زبان شناسی در ارتکاب سرقت ادبی را پشتیبانی می کند مثل تغییر متن ها به معادل معنایی اما با واژه هایمختلف، کوتاه کردن متون با تعمیم مفهوم و مشخصات و اتخاذ ایده ها.در همین راستا در این تحقیق، بهبود روشی برای تشخیص سرقت ادبی پیشنهاد می شود. در این روش ابتدا پیش پردازشی بر رویاسناد انجام می دهیم و سپس الگوریتم اسمیز واترمن را برای ساخت ماتریس تطابق اعمال می کنیم. بعد از ساخت ماتریس سعیمی کنیم زیر رشته هایی که دارای اختلاف کمی هستند را با یکدیگر تلفیق کنیم و در ادامه به هر یک از جمله ها وزن می دهیم.مجموعه آزمایشات بر روی دیتا ست PAN13 انجام شده است و با چهار نفر برتر مسابقه کشف سرقت ادبی در سال 2013مقایسه می گردد و با توجه به نتایج بدست آمده کارایی بهتر الگوریتم پیشنهادی نسبت به چهار نفر برتر مسابقه نشان داده می شود.

Keywords:

سرقت ادبی , تشخیص سرقت ادبی , متن کاوی

Authors

عمار توکلی

مرضیه احمدزاده

رضا اکبری

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

H. A. Maurer, F. Kappe, and B. Zaka, "Plagiarism-A Survey., ...
Osman, A.H, Salim, N and Abuobied, A, "Survey of Text ...
E. Stamatatos, "Plagiarism detection using stopword n-grams, " J. Am. ...
M. Elhadi and A Al-Tobi, "Use of text syntactical structures ...
J. Agarwal, R. H. Goudar, P. Kumar, N. Sharma, V. ...
Y. Li, D. McLea, Z. Bandar, J. D. O'shea, K. ...
D. Gupta, K. Vani, and C. K. Singh, "Using Natural ...
E. Stamatatos, "Plagiarism detection based on structural information, " in ...
A. H. Osman, N. Salim, and A. A. E. Elhadi, ...
M. Chong, L. Specia, and R. Mitkov, "Using natural language ...
F. Sanchez-Vega, E. Villatoro-Tello, M. Montes-y- Gomez, L. Villasen or-Pineda, ...
Hartrumpf, A. S., Bruck, T., & Eichhorn, C. Semantic duplicate ...
Hoad, T. C., & Zobel, J. Methods for identifying versioned ...
Shivakumar, D. N., & Garcia-Molina. H. SCAM: A copy detection ...
Zechner, M., Muhr, M., Kern, R., & Granitzer, M. External ...
Yergeau, F., UTF-8, _ transformation format of ISO 10646. 2003. ...
Islam, A. and D. Inkpen, Semantic text similarity using corpus-based ...
Potthast, M., et al. Overview of the 5th international competition ...

نمایش کامل مراجع