تشخیص هویت نویسنده اسناد متنی مبتنی بر یادگیری عمیق

سینا, آهنگری; کامبیز, مجیدزاده; امین, بابازاده سنگر

تشخیص هویت نویسنده اسناد متنی مبتنی بر یادگیری عمیق

عنوان مقاله: تشخیص هویت نویسنده اسناد متنی مبتنی بر یادگیری عمیق
شناسه ملی مقاله: CEITCONF03_033
منتشر شده در سومین کنفرانس ملی کامپیوتر، فناوری اطلاعات و کاربردهای هوش مصنوعی در سال 1398

مشخصات نویسندگان مقاله:

سینا آهنگری - دانشجوی کارشناسی ارشد فناوری اطلاعات، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران
کامبیز مجیدزاده - استادیار، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران
امین بابازاده سنگر - استادیار، گروه کامپیوتر، واحد ارومیه، دانشگاه آزاد اسلامی، ارومیه، ایران

خلاصه مقاله:

بطور کلی تشخیص نویسنده متون تلاشی برای نشان دادن خصوصیات تولیدکننده یا نویسنده یک تکه از اطلاعات زبانی تعریف میشود،به طوریکه بتوان بین متون مختلف که نوشته افراد مختلف اند، تمایز قائل شویم .شناسایی نویسنده از روی نثر سبک و شیوه نوشتاری، یا به عبارت دیگر ویژگی های نهفته درمتون نوشته شده توسط وی می باشد.ترکیب خصوصیات نوشتاری مانند طول کلمات، چینش پاراگراف ها، پرمایگی واژگان، استفاده از کلمات تابعی و غیره را تشکیل میدهند. از طریق این خصیصه های سبک شناختی، که معمولا در طول نوشتار یک فرد ثابت هستند شناسایی هویت نویسنده متون انجام میگیرد. در ارائه روشهای تشخیص نویسنده متون نکته حائز اهمیت، انتخاب ویژگی های کلیدی و حذف ویژگیهای اضافی و غیرمرتبط در تشخیص نویسنده متون میباشد. لذا از اینرو ما در این مقاله روشی براساس شبکه های عصبی و یادگیری عمیق برای انتخاب ویژگیها در تشخیص نویسنده اسناد متنی ارائه دادیم. با استفاده از مجموعه داده های روییتر، تعداد متون دسته بندی شده درست، نادرست و مقدار معیارهای ارزیابی دقت، در روش پیشنهادی مورد بررسی و ارزیابی قرار گرفته شده است. ارزیابی نتایج ، بازخوانی، صحت بیانگر دقت بالا و نتایج بهینه روش پیشنهادی درمقایسه با سایر روشهای استخراج ویژگی های متون درتشخیص هویت نویسنده اسناد متنی میباشد.

کلمات کلیدی:

احراز هویت نویسنده ، حریم خصوصی، شبکه عصبی پیچیده، سبک نوشتاری، افزایش امنیت متون

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1015578/