ارایه یک الگوریتم کارامد جهت تعیین جنسیت نویسنده درزبان فارسی بااستفاده ازروشهای هوشمند

Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 502

This Paper With 13 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ECIE03_016

تاریخ نمایه سازی: 22 دی 1396

Abstract:

امروزه گسترش فضای مجازی و متعاقب آن فعالیت بیشتر افراد و رفع اکثر نیازهای روزمره خود از این فضا به حد قابل توجهی گسترش یافته است. این موضوع در حالیست که اکثر کاربران این فضا میتوانند با مخفی نگهداشتن شخصیت حقیقی خود اقدام به فعالیت نمایند. راهکارهای شناسایی جنسیت افراد از روی متنهای منتشر شده در فضای مجازی عمدتا بر اساس معیارهای زبانشناسی است. استفاده از این راهکار علاوه بر تعیین هویت افراد می تواند در بازاریابی برخط نیز بسیار موثر باشد چراکه بر اساس آن میتوان روحیات افراد را بر اساس جنسیت شناخت و تبلیغات هدفمندی در این رابطه انجام داد. در این مقاله با توجه به ساختار و نگارش زبان فارسی که دارای ویژگیهای بسیاری است توانستیم الگوریتم کارآمدی که بر اساس روشهای یادگیری ماشین بنا نهاده شده است را ارایه دهیم. در این الگوریتم با استفاده از الگوریتم ژنتیک ویژگی برتر متون را استخراج نمودیم و با استفاده از دستهبند درختCART آنها را جهت تعیین هویت با استفاده از یک برنامهنویسی ژنتیک مورد بررسی قرار دادیم که نتایج حاکی از صحت شناسایی تا 84 % را در بر دارد