CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک سیستم نوین هوشمند تشخیص هویت نویسنده فارسی زبان بر اساس سبک نوشتاری - مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران

عنوان مقاله: یک سیستم نوین هوشمند تشخیص هویت نویسنده فارسی زبان بر اساس سبک نوشتاری - مقاله برگزیده هفدهمین کنفرانس ملی انجمن کامپیوتر ایران
شناسه ملی مقاله: JR_SCJKA-1-2_003
منتشر شده در در سال 1391
مشخصات نویسندگان مقاله:

زینب فرهمندپور
هومن نیک مهر
محرم منصوری زاده
امید طیب زاده قمصری

خلاصه مقاله:
پیشرفت سریع ارتباطات اینترنتی و استفاده ی نادرست از ناشناس بودن متون آنلاین، باعث به وجود آمدن مسائل امنیتی شده است. هویت ناشناس ابزارهای اینترنتی مانند ایمیل ها، وبلاگ ها و وب سایت ها به روش های ارتباط مورد علاقه ای برای کاربردهای جنایی تبدیل شده است. روابط سیاسی و اجتماعی جهان باعث توجه زیادی به زبان فارسی شده است. که این موضوع خود موجب فراوانی متون فارسی در اینترنت گردیده است. در این مقاله یک روش هوشمند writeprint معرفی شده است که به شناسایی یک نویسنده فارسی زبان بر اساس سبک نوشتاری او کمک می کند. در این تحقیق از ویژگی های واژگانی، نحوی، معنایی و وابسته به کاربرد، برای شناسایی هویت استفاده شده است. و کارایی انواع مختلف این ویژگی ها و همچنین اثرات روش های دسته بندی KNN و Delta به همراه ترکیب این روش ها با الگوریتم ژنتیک روی دو پایگاه داده ی جمع آوری شده بررسی شده است. در کنار سایر ویژگی ها برای پیاده سازی روش پیشنهادی یک pos tagger طراحی شده است که از ساختار کلمات برای تشخیص اسم، صفت و قید استفاده می نماید. آزمایشات انجام شده در این تحقیق نشان دادند که در بین روش های دسته بندی بررسی شده، ترکیب KNN و الگوریتم ژنتیک دقت بالاتری را در تشخیص هویت مالک اثر ادبی تولید کرد.

کلمات کلیدی:
تشخیص هویت نویسنده, سبک نوشتاری, writeprint

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1487082/