امکانات و کاستی های ستاک یابی فارسی در پردازش زبان طبیعی

Publish Year: 1404
نوع سند: مقاله ژورنالی
زبان: Persian
View: 51

This Paper With 18 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JLW-13-1_001

تاریخ نمایه سازی: 20 اسفند 1403

Abstract:

برای سرعت بخشیدن و آسانی انتقال و گسترش دانش، فرایندهای ذخیره و مبادله اطلاعات خودکارسازی می شوند. پردازش زبان طبیعی از محورهای این خودکارسازی است. زبان شناسان نظری می توانند در پیشبرد مطالعات پردازش زبان طبیعی نقش تاثیرگذاری ایفا کنند. آن ها باتکیه بر دستاوردهای مطالعات زبان شناختی می توانند با شناسایی شباهت های زبان ها به یکدیگر ابزاری را که متخصصان پردازش زبان طبیعی برای زبانی مشخص طراحی کرده اند، براساس شباهت برای زبان دیگری پیشنهاد دهند. به عبارتی، زبان شناسان نظری می توانند به تعمیم نتایج پژوهش های پردازش زبان طبیعی کمک کنند. در این مقاله، رویکردهای ستاک یابی زبان فارسی ازمنظر زبان شناسی نظری مطالعه و تحلیل شده اند. تحلیل صرفی از مراحل پردازش زبان طبیعی است که به صورت کلمه می پردازد. ستاک یابی نیز از مراحل اصلی تحلیل صرفی است که بر کاهش صورت واژه تصریف شده یا واژه مشتق تا رسیدن به ریشه یا ستاک تمرکز دارد. ازنظر زبانی، غنای صرفی، مسائل خط فارسی و منابع محدود باعث شده اند ستاک یابی در زبان فارسی به پژوهشی دشوار تبدیل شود. پیمودن این مراحل دشوار در گرو طراحی روش هایی کارآمد برای مولفه های خاص زبان فارسی است. پس از تحلیل رویکردهای مختلف ستاک یابی همچون رویکردهای ساختاری، آماری و یادگیری عمیق برای زبان هایی با مسائل مشابه مسائل زبان فارسی، ستاک یابی با استفاده از الگوی دنباله به دنباله برای زبان فارسی پیشنهاد می شود.

Authors

مریم اسدی

دانشجوی دکتری زبان شناسی، گروه زبان شناسی، دانشکده ادبیات و زبان های خارجی، دانشگاه علامه طباطبائی، تهران، ایران.

ویدا شقاقی

استاد، گروه زبان شناسی، دانشکده ادبیات و زبان های خارجی، دانشگاه علامه طباطبائی، تهران، ایران.

محسن کاهانی

استاد، گروه مهندسی کامپیوتر، دانشکده فنی و مهندسی، دانشگاه فردوسی، مشهد، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • اسلامی، محرم (۱۳۸۱). دشواری های پردازش رایانه ای خط فارسی. ...
  • دبیرمقدم، محمد (۱۳۸۴). پژوهش های زبان شناختی فارسی (مجموعه مقالات). ...
  • شقاقی، ویدا ([۱۳۸۶] ۱۳۹۲). مبانی صرف. تهران: سمت ...
  • شقاقی، ویدا (۱۳۹۴). فرهنگ توصیفی صرف. تهران: علمی ...
  • نساجیان، مینو؛ شجاعی، راضیه؛ بحرانی، محمد (۱۳۹۸). ساخت اضافه در ...
  • نمایش کامل مراجع