Publisher of Iranian Journals and Conference Proceedings

Please waite ..
Publisher of Iranian Journals and Conference Proceedings
Login |Register |Help |عضویت کتابخانه ها
Paper
Title

مقایسه روش های کلاسیک و روش های مبتنی بر اندازه های آماری پیکرهبنیاد در استخراج خودکار واژه های پایه علوم پزشکی به روش بسامدی

پژوهشنامه آموزش زبان فارسی به غیر فارسی زبانان، دوره: 8، شماره: 1
Year: 1398
COI: JR_JTPSOL-8-1_011
Language: PersianView: 42
This Paper With 20 Page And PDF Format Ready To Download

Buy and Download

با استفاده از پرداخت اینترنتی بسیار سریع و ساده می توانید اصل این Paper را که دارای 20 صفحه است به صورت فایل PDF در اختیار داشته باشید.
آدرس ایمیل خود را در کادر زیر وارد نمایید:

Authors

زهره ذوالفقار کندری - دانشجوی زبانشناسی همگانی، دانشگاه پیام نور، ایران.
طیبه موسوی میانگاه - دانشیارگروه زبانشناسی همگانی، دانشگاه پیام نور، ایران.
بلقیس روشن - دانشیارگروه زبانشناسی همگانی، دانشگاه پیام نور ، ایران.

Abstract:

طی دو دهه ی اخیر با پیشرفت علم و فناوری، استفاده از روش های پیکره­بنیاد در آموزش زبان و تدوین منابع درسی گسترش چشمگیری داشته است. پژوهش حاضر با هدف دستیابی به روشی خودکار در استخراج واژه از پیکره ها در زبان فارسی صورت گرفته است. برای دستیابی به هدف پژوهش روش های بسامد شماری در دو گروه کلاسیک و روش های مبتنی بر اندازه های آماری موردبررسی قرارگرفته و توانمندی هریک از که عبارتند از بسامدشماری پیکره ی عمومی، بسامدشماری پیکره ی تخصصی و روش های بهبودیافته ی آن ها موردمقایسه قرارمی گیرند. نتایج نشان می دهد که در روش های کلاسیک با اعمال تکنیک هایی می توان فرایند انتخاب واژه های تخصصی را بهبود بخشید و در این میان بهترین عملکرد مربوط به روش بسامدشماری بهبود یافته در پیکره­ی تخصصی بوده است. روش های به­کاررفته در پژوهش عبارتند از اطلاعات متقابل نقطه­ای و مجذور کا[۱]. نتایج به­دست آمده برای این دو روش نیز قابلیت استفاده از روش های بسامدشماری پیکره­بنیاد در زبان فارسی را مورد تایید قرار می دهد. روش مجذور کا با استخراج %۳۲ واژه­ی تخصصی و روش اطلاعات متقابل نقطه­ای با استخراج %۵۲ واژه­ی تخصصی، عملکرد مناسبی در تشخیص خودکار واژه های تخصصی از خود نشان می دهند. نتایج حاصل از اعمال این روش ها روی پیکره ها و مقایسه آن­ها نشان می­دهند که  می توان از روش های مبتنی بر اندازه­گیری های آماری برای استخراج خودکار واژه در زبان بهره جست و به این ترتیب تحولی نوین در تهیه و تدوین متون آموزشی حاصل خواهد شد و آموزش دهندگان می توانند به فهرست واژگانی دسترسی داشته باشند که دانستن آن برای زبان آموزانشان مفید و گاه ضروری است.  

Keywords:

استخراج خودکار واژه های پزشکی , پیکره , روش های ترکیبی استخراج , آموزش زبان فارسی

Paper COI Code

This Paper COI Code is JR_JTPSOL-8-1_011. Also You can use the following address to link to this article. This link is permanent and is used as an article registration confirmation in the Civilica reference:

https://civilica.com/doc/1321933/

How to Cite to This Paper:

If you want to refer to this Paper in your research work, you can simply use the following phrase in the resources section:
ذوالفقار کندری، زهره و موسوی میانگاه، طیبه و روشن، بلقیس،1398،مقایسه روش های کلاسیک و روش های مبتنی بر اندازه های آماری پیکرهبنیاد در استخراج خودکار واژه های پایه علوم پزشکی به روش بسامدی،https://civilica.com/doc/1321933

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

  • جهانگردی، کیومرث، عاصی، مصطفی، افراشی، آزیتا و وکیلی فرد، امیررضا. ...
  • رسولی، محمدصادق و مینایی بیدگلی، بهروز. (۱۳۸۷). روشی جدید در ...
  • سپهری، مهرداد. (۱۳۹۵). بسامدنگاری و دستاورد های آن در آموزش. ...
  • نعمت زاده، شهین. (۱۳۹۵). واژگان پایه در خدمت تالیف کتاب ...
  • Refrences:Biber, D. (۱۹۹۳) .Representativeness in corpus design. Literary and Linguistic ...
  • Biber,D. (۱۹۹۰). Some methodological Issues in Corpus Based Analyses of ...
  • Bin, H & Zhang, Y. (۲۰۱۳). Automatic Term Extraction in ...
  • Chujo, K., Oghigian, K., Nishigaki, C., Utiyama, M., & Nakamura, ...
  • Chujo, K., Nishigaki, C., & Utiyama, M. (۲۰۰۵). Selecting ۵۰۰ ...
  • Chujo, K., Utiyama, M., & Nakamura, T. (۲۰۰۷). Extracting Level-Specific ...
  • Chujo, K. (۲۰۰۴). Measuring Vocabulary Levels of English Textbooks and ...
  • Coxhead, A., & Nation, P. (۲۰۰۱). The specialised vocabulary of ...
  • Daille, B. (۱۹۹۴). Study and implementation of combined techniques for ...
  • Enguehard, C. & Pantera, L. (۱۹۹۵). Automatic natural acquisition of ...
  • Foo, J. (۲۰۱۲).Computational Terminology: Exploring Bilingual and Monolingual Term Extraction, ...
  • Francis, W. N. (۱۹۹۲). Language corpora BC. In Directions in ...
  • Frantzi, K., Ananiadou, S., & Mima, H. (۲۰۰۰). Automatic recognition ...
  • Gries, S. T. (۲۰۱۰). Useful statistics for corpus linguistics. A ...
  • Granger, S. (۲۰۱۵). The contribution of learner corpora to reference ...
  • Hulth, A. ( ۲۰۰۴). Combining Machine Learning and Natural Language ...
  • McEnery, T. (۲۰۰۱). Corpus linguistics: An introduction. Edinburgh University Press ...
  • Nematzadeh, Sh. (۲۰۱۳). Core Vocabulary Serving the First Grade Primary ...
  • Pantel, Pand. & Lin, D.(۲۰۰۱). A Statistical Corpus-Based Term Extractor. ...
  • Patry, A & .Langlais, P. (۲۰۰۵).Corpus-based terminology extraction. In Terminology ...
  • Rasooli ,M. S. & Minaei-Bidgoli, B. (۲۰۰۸). A new approach ...
  • Rezai, M. J. & Mosavi Miangah, T. (۲۰۱۷). FarsiTag: a ...
  • Sepehri ,M. (۲۰۰۶). Concordancing and its Pedagogical Implications. Language & ...
  • Sinclair, J. (۱۹۹۸). Corpus evidence in language description, In Gerry ...
  • Vulanovic, R. & Mosavi Miangah, T. (۲۰۱۸). A Comparison of ...

Research Info Management

Certificate | Report | من نویسنده این مقاله هستم

اطلاعات استنادی این Paper را به نرم افزارهای مدیریت اطلاعات علمی و استنادی ارسال نمایید و در تحقیقات خود از آن استفاده نمایید.

Scientometrics

The specifications of the publisher center of this Paper are as follows:
Type of center: پیام نور
Paper count: 61,569
In the scientometrics section of CIVILICA, you can see the scientific ranking of the Iranian academic and research centers based on the statistics of indexed articles.

Share this page

More information about COI

COI stands for "CIVILICA Object Identifier". COI is the unique code assigned to articles of Iranian conferences and journals when indexing on the CIVILICA citation database.

The COI is the national code of documents indexed in CIVILICA and is a unique and permanent code. it can always be cited and tracked and assumed as registration confirmation ID.

Support