استخراج خودکار معادل‎های واژگانی از پیکره‎های دو زبانه موازی

Publish Year: 1394
نوع سند: مقاله ژورنالی
زبان: Persian
View: 202

This Paper With 14 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

JR_JRLU-7-2_001

تاریخ نمایه سازی: 6 دی 1400

Abstract:

 امروزه به مدد ظهور انواع فناوری های رایانه ای، پیکره های زبانی نقش بسیار مهمی در حل انواع مختلف مسائل زبانشناختی ایفا می‎کنند. پیکره های دو زبانه موازی در سطح جمله و در سطح واژه می‎توانند برای بازیابی واحدهای تک واژه ای و یا حتی چند واژه‎ای براحتی مورد استفاده قرار‎گیرند که این امر کاربردهای مفیدی در حوزه‎های مختلف رایانه و زبان خواهد‎ داشت. هدف این مقاله به کارگیری یک پیکره موازی انگلیسی– فارسی از‎قبل طراحی‎شده در‎جهت ساخت یک مطابقه[۱] (کشف اللغات) دو زبانه کارآمد با‎ استفاده از آماره اطلاعات متقابل است. در اینجا از آماره اطلاعات متقابل استفاده می‎شود تا همترازی در سطح واژه بین جملات انگلیسی و فارسی پیکره مورد ‎نظر صورت‎گیرد. یک پیکره زبانی همتراز شده در سطح واژه مسلما کاربردهای زیادی از جمله در تهیه نرم‎افزار حافظه ترجمه، مدیریت مجموعه اصطلاحات، بازیابی اطلاعات دوزبانه، سیستم ترجمه ماشینی مبتنی ‎بر‎آمار و مانند آن دارد. با استفاده از یک الگوریتم ابتکاری آزمایشی ترتیب‎ داده ‎شده و مقایسه‎ای بین برونداد همترازسازی خودکار با جملات همتراز‎شده توسط مترجم انسانی صورت‎گرفت. نتایج این آزمایش نشان‎ داد که برنامه مطابقه گزارش شده در این تحقیق می تواند صحتی معادل ۷۵‎ درصد را به دست آورد. [۱] concordance

Authors

طیبه موسوی میانگاه

دانشیار گروه زبان شناسی دانشگاه پیام نور

مهشید شکیبا

کارشناس ارشد گروه کامپیوتر دانشگاه پیام نور

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • نظارات، امین و موسوی میانگاه، طیبه (۱۳۹۰). طراحی و پیاده ...
  • Brown, P. F., Della Pietra, V. S. A.; Della Pietra, ...
  • Church, K. W. and Hanks, P. (۱۹۹۰). Word association norms, ...
  • Fung, P. (۱۹۹۵). A pattern matching method for finding noun ...
  • Gale, W. A. and K. W. Church, (۱۹۹۱). “Identifying word ...
  • Dagan, I. Kenneth W. Ch, and William A. G. (۱۹۹۳). ...
  • Inoue, N. and Nogaito, I. (۱۹۹۳). Automatic construction of the ...
  • lshimoto, H and Nagao, M. (۱۹۹۴). Automatic construction of a ...
  • Johns, T. (۱۹۸۶). Microconcord: A language-learner's research tool. System ۱۴(۲), ۱۵۱-۱۶۲ ...
  • Johns, T. (۱۹۹۸). Multiconcord: the lingua multilingual parallel concordancer for windows. ...
  • Kupiec, J. (۱۹۹۳). An algorithm for finding noun phrase correspondences ...
  • Mauser, A., Matusov, E and Ney, H. (۲۰۰۶). Training a ...
  • Mosavi Miangah, T. (۲۰۰۶). Applications of corpora in translation. Translation Studies ۱۲, ...
  • Mosavi Miangah, T. (۲۰۰۹). Constructing a large-scale English-Persian Parallel Corpus. META ۵۴ (۱), ...
  • Mosavi Miangah (in Press). FarsiTag: A part of speech tagging ...
  • Och, Franz J. (۲۰۰۰). Giza++: Training of statistical translation models. ...
  • Och, F. J. and Ney, H. (۲۰۰۳). A systematic comparison ...
  • Och, F. and Ney, H. (۲۰۰۱). Improved Statistical Alignment Models, Proceedings ...
  • Rensik, P. (۱۹۹۸). “Parallel strands: A preliminary investigation into mining ...
  • Rensik, P. (۱۹۹۹): “Mining the web for bilingual text”. Proc. of ...
  • Scott, M. (۲۰۰۰). WordSmith Tools Version ۳.۰ [Computer software]. Oxford: Oxford University ...
  • Simard, M. and Plamondon, P. (۱۹۹۸). Bilingual sentence alignment: balancing ...
  • Wang L. (۲۰۰۱). Exploring parallel concordancing in English and Chinese. Language ...
  • Wu, J. C.; Yeh, K.; Chuang, C.; Thomas C., Shei, W. C. ...
  • Yamamoto, Y. and Sakamoto, M. (۱۹۹۳). Extraction of technical term ...
  • نمایش کامل مراجع