CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تحلیل پیکره بنیان متون فارسی میانه بر مبنای پایگاه داده پارسیگ

عنوان مقاله: تحلیل پیکره بنیان متون فارسی میانه بر مبنای پایگاه داده پارسیگ
شناسه ملی مقاله: JR_LANG-12-1_009
منتشر شده در در سال 1400
مشخصات نویسندگان مقاله:

فرزانه گشتاسب - دانشیار زبان های باستانی، پژوهشگاه علوم انسانی و مطالعات فرهنگی(نویسنده مسئول)
مسعود قیومی - استادیار زبانشناسی،پژوهشگاه علوم انسانی و مطالعات فرهنگی
نادیا حاجی پور ارطرانی - کارشناس پژوهشی گروه فرهنگ و زبان های باستانی، پژوهشکده زبان شناسی، پژوهشگاه علوم انسانی و مطالعات فرهنگی

خلاصه مقاله:
رویکرد نوین در مطالعات زبان‎شناختی یا یک پدیده زبانی بر اصل وجود مجموعه ای از داده های زبانی گردآوری شده نهادینه شده‎است؛ بنابراین به تهیه یک پیکره زبانی نیاز  است که از تولیدات واقعی گویشوران و نه براساس شم زبانی فردی گردآوری شده‎است. این شیوه پژوهشی برای بررسی داده‎های زبانی تاریخی که جزء زبان های مرده است و اکنون هیچگونه گویشوری ندارد از اهمیت به‎سزایی برخوردار است. هدف از انجام این پژوهش، تهیه پیکره زبان پهلوی ساسانی (فارسی میانه) و ساماندهی آن در یک پایگاه است. برای هر واژه، شش لایه اطلاعاتی، اعم از حرفنویسی متن پهلوی، آوانویسی واژه ها به همراه ترجمه فارسی آنها، تعیین مقوله دستوری دانه‎ریز واژه ها، بن واژه سازی واژه ها و تعیین هزوارش بودن آنها، تعریف شده‎است. برای مقوله دستوری دانه‎ریز واژه‎ها، مجموعه برچسب مقولات دستوری فارسی معاصر تهیه‎شده توسط بی‎جن‎خان و همکاران (۲۰۱۱) و ساختارمندشده توسط قیومی (۲۰۱۴) باتوجهبه نیازهای زبان پهلوی جرح و تعدیل شده است و از مجموعه جدید برای برچسب‎گذاری واژه‎های پهلوی استفاده شده است. پس ‎از نشانه گذاری واژه‎ها و ساماندهی اطلاعات، امکان استخراج اطلاعات آماری وجود دارد که می‎تواند بینش عمیق‎تری از محتوای متن منتقل نماید. ازاین رو، اطلاعات آماری از پیکره به دست آمده استخراج شده و توضیح داده می شود تا دورنمای کلی نسبت به منابع تشکیل دهنده این پیکره به دست آید.

کلمات کلیدی:
زبان پهلوی, زبان شناسی پیکره‎ای, پایگاه داده, نشانه‎گذاری داده

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1512112/