تشخیص نویسنده یک متن با استفاده از پردازش زبان طبیعی

Publish Year: 1402
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 18

This Paper With 18 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

THCONF07_105

تاریخ نمایه سازی: 9 تیر 1403

Abstract:

در این مقاله، یک روش جدید به منظور شناسایی نویسنده متون فارسی با استفاده از تکنیک های یادگیری ماشین و پردازشزبان طبیعی ارائه شده است. در روش پیشنهادی از مجموعه خصوصیات آماری و محتوایی متون در کنار مشخصاتروانشناختی نویسندگان استفاده میشود. در گام اول روش پیشنهادی، مجموعه متون ورودی پیش پردازش شده و هر سندمتنی به مجموعه جملات تشکیل دهنده آن تجزیه میشود. پس از انجام عملیات پیش پردازش، نقش دستوری کلماتتشکیل دهنده هر جمله در متون ورودی شناسایی شده و براساس فراوانی برچسب های شناسایی شده، مجموعه ویژگی هایآماری متن استخراج میگردد. در گام بعدی روش پیشنهادی، کلمات کلیدی موجود در متن استخراج شده و بردار وزنی TF-IDF برای کلمات کلیدی استخراج شده از هر متن محاسبه خواهد شد. در گام بعدی، مجموعه ویژگی های آماری متن وبردار TF-IDF کلمات کلیدی متون با ویژگی های جمع آوری شده از طریق آزمون روانشناسی نویسندگان ادغام شده تامجموعه ویژگی های نهایی حاصل شود. در نهایت این ویژگی ها توسط یک مدل یادگیر مبتنی بر ترکیب شبکه عصبیمصنوعی و کدگذاری خروجی تصحیح کننده خطا مورد پردازش قرار گرفته تا نویسندگان مربوط به هر متن شناسایی شود. بهمنظور ارزیابی عملکرد روش پیشنهادی از یک پایگاه داده متشکل از ۱۵ نویسنده استفاده شده است. کارایی روش پیشنهادیدر تشخیص نویسندگان متون فارسی مورد ارزیابی قرار گرفته و نتایج حاصل با روشهای مشابه پیشین مقایسه شده است.نتایج حاصل نشان میدهد که روش پیشنهادی در تشخیص نویسندگان از دقت بالایی برخوردار بوده و میتواند در پردازشمتون فارسی بصورت کارآمدی عمل نماید.

Authors

علی نوری

دانشجوی کارشناسی ارشد، گروه فناوری اطلاعات، موسسه آموزش عالی باختر، ایلام، ایران