CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص سرقت ادبی در متون علمی مبتنی بر بلوک بندی متن و معیار مشابهت کسینوسی

عنوان مقاله: تشخیص سرقت ادبی در متون علمی مبتنی بر بلوک بندی متن و معیار مشابهت کسینوسی
شناسه ملی مقاله: JR_SCJKA-11-1_005
منتشر شده در در سال 1401
مشخصات نویسندگان مقاله:

نگار مجمع - گروه مهندسی کامپیوتر، موسسه آموزش عالی نقش جهان، اصفهان، ایران
سارا باشتین - گروه مهندسی کامپیوتر، موسسه آموزش عالی نقش جهان، اصفهان، ایران

خلاصه مقاله:
در دهه اخیر با گسترش دسترسی به شبکه جهانی اینترنت، سرعت و سهولت در دسترسی به ایده ها، مستندات، مقالات، دست نوشته ها و داده های جمع آوری شده توسط دیگران افزایش یافته است. این موضوع باعث شده است که تبادل اطلاعات و افکار بین محققین و تولیدکنندگان علوم آسان تر شود، اما در مقابل باعث آسان شدن اعمال رونوشت غیرمجاز، خلاصه نویسی بدون ذکر منبع و در کل سرقت متون ادبی شده است. از آنجایی که دانشگاه ها و مراکز آموزشی، منابع علمی و پژوهشی را با سهولت در دسترس اغلب کاربران قرار می دهند، تشخیص میزان اصالت متون علمی در این مراکز مهم تر و بالطبع آن از حساسیت بیشتری برخوردار است. در این پژوهش روشی ارائه شده تا با استفاده از بلاک بندی قطعات اسناد، مقایسه بین قطعات مرتبط انجام شود. در روش پیشنهادی پس از دسته بندی اسناد به دو دسته اسناد اصلی و اسناد مشکوک، پیش پردازشی با هدف حذف ایست واژه ها و جمله بندی جدید صورت پذیرفته است. سپس اسناد قطعه بندی شده و با استفاده از شباهت کسینوسی، میزان شباهت متون با یکدیگر تعیین شده است. روش پیشنهادی در آزمون ۵۰ سند موجود در مجموعه داده ها، دقت ۹۴ درصدی را کسب کرده که به نسبت به یکی از روش های مشابه بهبود ۲ درصدی داشته است.

کلمات کلیدی:
سرقت علمی ادبی, تشخیص اصالت متون علمی, فاصله ی کسینوسی, بلوک بندی متن, پردازش متن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1631680/