واژه های دستوری به مثابه نشانگرهای گویش فردی: رویکردی پیکره ای به شناسایی هویت نویسنده در زبان فارسی
Publish place: Language Related Resaerch، Vol: 10، Issue: 3
Publish Year: 1398
نوع سند: مقاله ژورنالی
زبان: Persian
View: 268
This Paper With 25 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
JR_LRR-10-3_013
تاریخ نمایه سازی: 18 مهر 1400
Abstract:
شناسایی هویت نویسنده یکی از حوزه های تحقیقاتی مهم در حیطه زبان شناسی حقوقی است که موضوع پژوهش های زبان شناختی و رایانشی گسترده در زبان های مختلف بوده است. با این حال شواهد محدودی از پژوهش های صورت گرفته با موضوع شناسایی نویسنده در زبان فارسی وجود دارد. در این پژوهش امکان شناسایی نویسنده یک متن با تکیه بر مفهوم گویش فردی و با استفاده از واژه های دستوری زبان فارسی بررسی شده است. واژه های دستوری از آن جهت که به طور ناخودآگاه در تولید زبان به کار گرفته می شوند، مستقل از موضوع متن به کار می روند و بسامد بالایی در متون کوتاه دارند، می توانند نشانگرهای موثری برای کدگذاری گویش فردی و ممیز سبک نویسندگان باشند. در این پژوهش، ابتدا پیکر ه هایی متنی از نوشته های پنج محقق و نویسنده معاصر جمع آوری و سپس با استفاده از نرم افزار خطایاب وفا، استانداردسازی شدند. با استفاده از بسته سبک سنجی stylo نرم افزار آماری R، واژه های پربسامد دستوری با توالی های یک تا سه نگاشتی از متون استخراج شدند و سپس قابلیت تفکیک متون بر اساس این واژه ها و با استفاده از تحلیل مولفه های اصلی و همچنین تحلیل خوشه ای بر اساس مقیاس فاصله ای دلتا بررسی شد. نتایج نشان داد که واژه های دستوری در زبان فارسی قابلیت تفکیک متون متعلق به یک نویسنده را دارند و عملکرد واژه های تک نگاشتی بهتر از دونگاشتی و سه نگاشتی ها در متون کم حجم است. همچنین نتایج پژوهش نشان داد که حجم کمینه متن برای شناسایی موفقیت آمیز نویسنده در متون فارسی حدود ۴۰۰۰ واژه بر اساس ۲۰ واژه دستوری پربسامد است.
Keywords:
Keywords: idiolect , authorship attribution , corpus analysis , forensic linguistics , delta method. , واژه های کلیدی: گویش فردی , شناسایی نویسنده , تحلیل پیکره ای , زبان شناسی حقوقی , روش دلتا.
Authors
رامین گلشائی
Assistant Professor of Linguistics- Al-Zahra University –Tehran –Iran.
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :