CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تشخیص هویت نویسنده با استفاده از متن کاوی مبتنی بر الگوریتم K- نزدیک ترین همسایه بهبود یافته

عنوان مقاله: تشخیص هویت نویسنده با استفاده از متن کاوی مبتنی بر الگوریتم K- نزدیک ترین همسایه بهبود یافته
شناسه ملی مقاله: CSCG01_096
منتشر شده در نخستین کنفرانس ملی محاسبات نرم در سال 1394
مشخصات نویسندگان مقاله:

نجمه حداد زاده شوشتری - گروه کامپیوتر (مهندسی کامپیوتر)، واحد علوم و تحقیقات خوزستان، دانشگاه آزاد اسلامی، اهواز، ایران، گروه کامپیوتر (مهندسی کامپیوتر)، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران
هدیه ساجدی - گروه کامپیوتر (مهندسی کامپیوتر)، واحد علوم و تحقیقات خوزستان، دانشگاه آزاد اسلامی، اهواز، ایران، گروه کامپیوتر (مهندسی کامپیوتر)، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران

خلاصه مقاله:
تشخیص هویت نویسنده یکی از مسایل مهم در دسته بندی و پردازش زبان طبیعی می باشد. در این مقاله جهت انجام تشخیص هویت از الگوریتم K- نزدیک ترین همسایه (روشی ساده، بی پارامتر و کارایی بالا نسبت به دیگر روش های دسته بندی) که یکی از روش های موثر و پرکاربرد در این زمینه می باشد، به کمک ابزارهای دیگر استفاده شده است. در ابتدا ویژگی های مختلفی از نوشته های نویسندگان استخراج شده و سعی گردیده براساس ویژگی های استخراج شده عملیات تشخیص هویت نویسنده شبیه سازی گردد. پس از استخراج ویژگی هایی همچون ویژگی های واژگانی، نحوی، معنایی و وابسته به کاربرد و مشخص نمودن بهترین ویژگی ها به کمک رو مختلف، داده ها توسط الگوریتم K نزدیک ترین همسایه دسته بندی می شود. الگوریتم سنتی K- نزدیک ترین همسایه دارای پیچیدگی محاسباتی زیادی می باشد. بنابراین در این مقاله برای رفع این مشکل از خوشه بندی استفاده نموده ایم. خوشه بندی توانست تا حد زیادی محاسبات را کاهش دهد، اما کاهش کارایی در دسته بندی K- نزدیک ترین همسایه را به همراه داشت. در ادامه برای رفع این مشکل از وزن دهی به مراکز خوشه ها استفاده گردید و این کار توانست مشکل کاهش کارایی را حل نماید. روش ارایه شده در تشخیص هویت نویسنده تاثیر به سزایی دارد و میانگین دقت با روش پیشنهادی به 96 % رسیده است.

کلمات کلیدی:
تشخیص هویت نویسنده، متن کاوی، استخراج ویژگی ها، K- نزدیک ترین همسایه، خوشه بندی، وزن دهی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/656606/