CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

همترازی متون با استفاده از روش ترکیبی مبتنی بر ساختار و معنا در کار تشخیص سرقت علمی-ادبی

عنوان مقاله: همترازی متون با استفاده از روش ترکیبی مبتنی بر ساختار و معنا در کار تشخیص سرقت علمی-ادبی
شناسه ملی مقاله: ISCC12_009
منتشر شده در دوازدهمین کنفرانس بین المللی انجمن رمز ایران در سال 1394
مشخصات نویسندگان مقاله:

مهرنوش خاموشی - دانشجوی کارشناسی ارشد، دانشکده برق-رایانه و فناوری اطلاعات، گروه مهندسی کامپیوتر-نرم افزار، دانشگاه آزاد اسلامی واحد قزوین، قزوین، ایران
محمد صنیعی آباده - استادیار ، دانشکده مهندسی برق و کامپیوتر ،دانشگاه تربیت مدرس ، تهران ، ایران

خلاصه مقاله:
تشخیص سرقت علمی- ادبی به فرآیندی گفته می شود که در آن به دنبال کشف منابع برای اسناد مشکوک به سرقت یا همان وظیفهبازیابی منبع که می تواند منابع گسترده وب باشد و همچنین یافتن عبارات سرقتی در متن مشکوک به سرقت و متن منبع بالقوه اشکه وظیفه همترازی متون نامیده می شود، هستیم. کار این مقاله در راستای وظیفه همترازی متون انجام شده است، یعنی به دنبال اینهستیم که پس از یافتن زیر مجموعه ای از منابع که احتمالا منبع سرقت سند مشکوک بوده اند، قسمت های سرقت شده را به صورتجزیی بازیابی کنیم.در روش پیشنهادی ما از دو روش تشخیص ساختاری و معنایی برای کشف عبارات سرقتی در متن استفاده شده است ، به اینمنظور ابتدا با توجه به شباهت ظاهری جملات مشکوک در مقابل عبارات منبع تعیین میکنیم که از کدام روش تشخیصی باید برای هرجمله و پاراگراف معادلش استفاده شود و سپس برای مقایسه ساختاری از استخراج ویژگی های مشترک استفاده می کنیم و برایمقایسه معنایی با استفاده از پایگاه دانش وردنت، مقدار شباهت معنایی جملات تحت حالتی مابین خوش بینانه و سخت گیرانهمحاسبه می شود، ارزیابی کارایی روش پیشنهادی ما روی مجموعه داده های رقابت جهانی پن که در زمینه سرقت علمی- ادبی استبررسی شده است و در نهایت خروجی کار ما بخش های سرقت شده از سند مشکوک و بخش های منبع متناظر آن با پوشش قابلقبولی از سطح سرقت مستقیم تا مبهم خواهد بود.

کلمات کلیدی:
تشخیص سرقت علمی– ادبی، همترازی متون، شباهت ساختاری، شباهت معنایی، استخراج ویژگی، پایگاه دانش وردنت

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/788084/