ارایه یک روش جدید انتخاب ویژگی در مسیله تایید هویت نویسنده

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 431

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NCNIEE06_028

تاریخ نمایه سازی: 1 مرداد 1397

Abstract:

تایید هویت نویسنده به بررسی نویسنده یک متن خاص، با داشتن نمونه های نوشتاری از آن نویسنده می پردازد؛ که این کار می تواند از طریق تکنیکهای stylometry انجام پذیرد. بیشتر مطالعات انجام شده با استفاده از stylometry یا بر روی مجموعه کوچکی از نویسندگان تمرکز دارند و یا اینکه بر روی متنهای طولانی اعمال می شوند در حالی که در شرایطی که stylometry استفاده می شود (مثل جرم یابی متن دیجیتال)،متنها کوتاه با ساختار ضعیف هستند. از این رو در این مقاله مسیله تایید هویت نویسنده در مجموعه بزرگی از نویسندگان شامل 101 نفر و بر روی پیامهای کوتاه آنلاین بررسی شده است. بدین منظور ویژگیهای سبکی شامل ویژگیهای واژگانی و نحوی از متن نویسنده هدف، استخراج شده و سپس برای کاهش تعداد زیاد ویژگیها و انتخاب موثرترین ویژگیها، روش های مختلف انتخاب ویژگی مورد بررسی قرار گرفت و از ماشین بردار پشتیبان (SVM) نیز برای طبقه بندی استفاده شد. ارزیابی روش پیشنهادی بر روی مجموعه ایمیلهای انرون، نشان می دهد که با استفاده از روش انتخاب ویژگی correlation در پیامهای کوتاه آنلاین 500) کاراکتری) می توان برای افراد مختلف به طور میانگین میزان دقت %97/1، و میزان معیار Recall و F-measure ، %96/95 را به دست آورد.

Authors

سارا آریا

ارایه یک روش جدید انتخاب ویژگی در مسیله تایید هویت نویسنده

پیروز شمسی نژادبابکی

استادیار دانشکده مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی شیراز،

علی جعفری

کارشناس ارشدمهندسی نرم افزار