روش ترکیبی جدید بر پایه وزن دهی و الگوریتم رتبه بندی متون برای تشخیص نویسنده متن

Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 104

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CECCONF20_050

تاریخ نمایه سازی: 24 مهر 1402

Abstract:

امروزه استفاده از وب به یکی از عناصر حیاتی زندگی انسانی تبدیل شده است. به همین دلیل حجم اطلاعاتی متنی در هر سطح به طرز چشم گیری افزایش یافته است. از این رو، در حال حاضر بیش از هر زمان دیگری نیاز به سیستم های پردازشگر زبان مانند، بازیابی کننده های اطلاعات، خلاصه سازها، مترجم ها و ... احساس می شود. همچنین؛ شناسایی نویسنده متن ، تلاشی است برای بدست آور دن خصوصیات نویسنده یک متن و مقایسه آنها با ویژگی های متون مختلفی که توسط چندین فرد نوشته شده است و به صورت تلفیقی از زبانشناسی و داده کاوی میباشد. در این پژوهش از رویکرد وزن و رتبه دهی جهت تشخیص نویسنده استفاده شده است. ابتدا تمام ویژگی های موجود در متن به بردار تبدیل شده و در مرحله بعد بر اساس روش TF-IDF به تمام ویژگی های استخراج شده وزنی اختصاص داده می شود و ویژگی هایی با وزن بالاتر به مرحله بعدی ارسال می شوند. سپس بر اساس معیار شباهت کسینوسی میزان شباهت متن ورودی با تمام متن های با امتیاز بالا بدست آمده و در نهایت براساس مدل گرافی متون مرتب سازی شده و متنی که بیشترین شباهت با متن ورودی را داشته باشد انتخاب می گردد و نویسنده آن بعنوان خروجی در نظر گرفته خواهد شد.

Authors

محمد غفاری آثار

دانشجوی کارشناسی ارشد، نرم افزار کامپیوتر، دانشگاه البرز، آبیک

رضا مرادی

دکتری مهندسی کامپیوتر، گرایش هوش مصنوعی، استادیار دانشگاه دانش البرز