یک سیستم نوین هوشمند تشخیص هویت نویسنده فارسی زبان بر اساس سبک نوشتاری - مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

Publish Year: 1391
نوع سند: مقاله ژورنالی
زبان: Persian
View: 163

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_SCJKA-1-2_003

تاریخ نمایه سازی: 31 تیر 1401

Abstract:

پیشرفت سریع ارتباطات اینترنتی و استفاده ی نادرست از ناشناس بودن متون آنلاین، باعث به وجود آمدن مسائل امنیتی شده است. هویت ناشناس ابزارهای اینترنتی مانند ایمیل ها، وبلاگ ها و وب سایت ها به روش های ارتباط مورد علاقه ای برای کاربردهای جنایی تبدیل شده است. روابط سیاسی و اجتماعی جهان باعث توجه زیادی به زبان فارسی شده است. که این موضوع خود موجب فراوانی متون فارسی در اینترنت گردیده است. در این مقاله یک روش هوشمند writeprint معرفی شده است که به شناسایی یک نویسنده فارسی زبان بر اساس سبک نوشتاری او کمک می کند. در این تحقیق از ویژگی های واژگانی، نحوی، معنایی و وابسته به کاربرد، برای شناسایی هویت استفاده شده است. و کارایی انواع مختلف این ویژگی ها و همچنین اثرات روش های دسته بندی KNN و Delta به همراه ترکیب این روش ها با الگوریتم ژنتیک روی دو پایگاه داده ی جمع آوری شده بررسی شده است. در کنار سایر ویژگی ها برای پیاده سازی روش پیشنهادی یک pos tagger طراحی شده است که از ساختار کلمات برای تشخیص اسم، صفت و قید استفاده می نماید. آزمایشات انجام شده در این تحقیق نشان دادند که در بین روش های دسته بندی بررسی شده، ترکیب KNN و الگوریتم ژنتیک دقت بالاتری را در تشخیص هویت مالک اثر ادبی تولید کرد.