ارایه یک روش جدید برای بهبود دادن مساله تشخیص جنسیت نویسنده متن

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 955

This Paper With 7 Page And PDF and WORD Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ACCSI22_100

تاریخ نمایه سازی: 13 شهریور 1396

Abstract:

مساله تشخیص جنسیت نویسنده متن، یکی از مسایل مورد استفاده در حوزه داده کاوی و متن کاوی است که جهت شناسایی هویت مجهول و یا غیر واقعی تعدادی از کاربران اینترنتی و کاربران شبکه های اجتماعی بکار رفته است. هدف از ارایه این مساله این است که با استفاده از یک یا چند روش بهینه در زمینه تجزیه و تحلیل متون، بتوان مدلی را استخراج کرد که با استفاده از آن، ضریب احتمال تشخیص صحیح برای تعیین جنسیت نویسندگان متون مورد نظر (مرد یا زن بودن نویسنده) را بالا ببریم.یکی از دلایل اصلی ضرورت پرداختن به این موضوع، جلوگیری از سوء استفاده های احتمالی از دیگر کاربران، توسط افراد ناشناس یا افراد با هویت جعلی، است. راهکارهایی که در این مقاله ، برای حل مساله تشخیص جنسیت نویسنده متن استفاده شده است، شامل دو بخش است، بخش اول شامل یک شیوه جدید وزن دهی به نام معکوس فراوانی سند وابسته به جنسیت (GIDF ) است که مبنای آن روش معکوس فراوانی سند ( idf) می باشد. بخش دوم استفاده از یک روش فراابتکاری ترکیبی مبتنی بر روش خفاش ها به نام روش ترکیبی خفاش ها-زنبورهای مصنوعی (BABC ) است که با الگوریتم طبقه بندی ماشین بردار پشتیبان ترکیب شده و وظیفه آن بهبود نتایج حاصل از طبقه بندی SVM بوسیله انتخاب بهترین ویژگیها جهت ساخت مدل پیشنهادی است. مجموعه داده مورد استفاده جهت ساخت مدل، شامل 3000 نمونه جمع آوری شده از متون نگاشته شده توسط مرد و زن در سایت بلاگفا است که 50 درصد از کل نمونه مربوط به متون مربوط به زن و 50 درصد دیگر مربوط به متون مربوط به زن است. نتایج بدست آمده توسط الگوریتم های پیشنهادی نشان می دهد که دقت کلاس بندی برابر با 85.5 درصد است.

Authors

صدیقه ابی زاد

دانشجوی کارشناسی ارشد ، گروه نرم افزار کامپیوتر ، دانشگاه گیلان،رشت

حمیدرضا احمدی فر

استادیار،مهندسی کامپیوتر،دانشگاه گیلان،رشت

سیدابوالقاسم میرروشندل

استادیار،مهندسی کامپیوتر،دانشگاه گیلان،رشت