راهکار اتوماتیک جدید برای تشخیص سرقت ادبی دو زبانه ( انگلیسی – فارسی)

Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 497

This Paper With 5 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

DCBDP05_069

تاریخ نمایه سازی: 6 آذر 1398

Abstract:

سرقت ادبی در حوزه های دانشگاهی و مراکز تحقیقاتی یکی از دغدعه های محققان به شمار میرود. در این مقاله قصد داریم از یک روش آماری برای تشخیص برگردان از متون انگلیسی به فارسی استفاده کنیم. یک فایل به زبان فارسی به سیستم پیشنهادی ارائه میشود و سیستم باید فایل یا فایلهایی از مجموعه اسناد انگلیسی که فایل مورد نظر از روی آنها نوشته شده است، را پیدا کرده و نمایش دهد. از آنجائیکه ذات مسئله تشخیص سرقت و بررسی میزان مشابهت، یک مسئله زمان بر است، سعی میشود تعداد فایلهایی که مورد بررسی قرار میگیرد تا حد ممکن کاهش یابد. برای این منظور از اصل عدم تغییر موضوع در سرقت ادبی استفاده کرده و اسناد را در گروه ها وموضوعات مختلف ردهبندی میکنیم و هر فایلی که به سیستم ارائه میشود، ابتدا با استفاده از یک رده بند موضوع آن مشخص شده و تنها با فایلهای انگلیسی که موضوع مشابه دارند، مورد مقایسه قرار میگیرد. برای مقایسه و بررسی میزان مشابهت ابتدا موقعیتهای هر کلمه سند فارسی در فایل انگلیسی با استفاده از یک دیکشنری به صورت یک بردار مشخص میشود و سپس با استفاده از یک روش محاسبه فاصله رخداد کلمات مجاور در سند فارسی و انگلیسی، میزان مشابهت سنجیده میشود.

Authors

مسلم محمدی جنقرا

استادیار، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران،

کوثر عباس خواه

گروه علوم تربیتی، دانشگاه پیام نور، تهران،