مقایسه روش های کلاسیک و روش های مبتنی بر اندازه های آماری پیکرهبنیاد در استخراج خودکار واژه های پایه علوم پزشکی به روش بسامدی

زهره ذوالفقار کندری; طیبه موسوی میانگاه; بلقیس روشن

مقایسه روش های کلاسیک و روش های مبتنی بر اندازه های آماری پیکرهبنیاد در استخراج خودکار واژه های پایه علوم پزشکی به روش بسامدی

Publish place: Journal of Teaching Persian to Speakers of Other Languages، Vol: 8، Issue: 1

Publish Year: 1398

نوع سند: مقاله ژورنالی

زبان: Persian

This Paper With 20 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1321933

شناسه ملی سند علمی:

JR_JTPSOL-8-1_011

تاریخ نمایه سازی: 2 آذر 1400

Abstract:

طی دو دهه ی اخیر با پیشرفت علم و فناوری، استفاده از روش های پیکرهبنیاد در آموزش زبان و تدوین منابع درسی گسترش چشمگیری داشته است. پژوهش حاضر با هدف دستیابی به روشی خودکار در استخراج واژه از پیکره ها در زبان فارسی صورت گرفته است. برای دستیابی به هدف پژوهش روش های بسامد شماری در دو گروه کلاسیک و روش های مبتنی بر اندازه های آماری موردبررسی قرارگرفته و توانمندی هریک از که عبارتند از بسامدشماری پیکره ی عمومی، بسامدشماری پیکره ی تخصصی و روش های بهبودیافته ی آن ها موردمقایسه قرارمی گیرند. نتایج نشان می دهد که در روش های کلاسیک با اعمال تکنیک هایی می توان فرایند انتخاب واژه های تخصصی را بهبود بخشید و در این میان بهترین عملکرد مربوط به روش بسامدشماری بهبود یافته در پیکرهی تخصصی بوده است. روش های بهکاررفته در پژوهش عبارتند از اطلاعات متقابل نقطهای و مجذور کا[۱]. نتایج بهدست آمده برای این دو روش نیز قابلیت استفاده از روش های بسامدشماری پیکرهبنیاد در زبان فارسی را مورد تایید قرار می دهد. روش مجذور کا با استخراج %۳۲ واژهی تخصصی و روش اطلاعات متقابل نقطهای با استخراج %۵۲ واژهی تخصصی، عملکرد مناسبی در تشخیص خودکار واژه های تخصصی از خود نشان می دهند. نتایج حاصل از اعمال این روش ها روی پیکره ها و مقایسه آنها نشان میدهند که می توان از روش های مبتنی بر اندازهگیری های آماری برای استخراج خودکار واژه در زبان بهره جست و به این ترتیب تحولی نوین در تهیه و تدوین متون آموزشی حاصل خواهد شد و آموزش دهندگان می توانند به فهرست واژگانی دسترسی داشته باشند که دانستن آن برای زبان آموزانشان مفید و گاه ضروری است.

Keywords:

استخراج خودکار واژه های پزشکی , پیکره , روش های ترکیبی استخراج , آموزش زبان فارسی

Authors

زهره ذوالفقار کندری

دانشجوی زبانشناسی همگانی، دانشگاه پیام نور، ایران.

طیبه موسوی میانگاه

دانشیارگروه زبانشناسی همگانی، دانشگاه پیام نور، ایران.

بلقیس روشن

دانشیارگروه زبانشناسی همگانی، دانشگاه پیام نور ، ایران.

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :

جهانگردی، کیومرث، عاصی، مصطفی، افراشی، آزیتا و وکیلی فرد، امیررضا. ...
رسولی، محمدصادق و مینایی بیدگلی، بهروز. (۱۳۸۷). روشی جدید در ...
سپهری، مهرداد. (۱۳۹۵). بسامدنگاری و دستاورد های آن در آموزش. ...
نعمت زاده، شهین. (۱۳۹۵). واژگان پایه در خدمت تالیف کتاب ...
Refrences:Biber, D. (۱۹۹۳) .Representativeness in corpus design. Literary and Linguistic ...
Biber,D. (۱۹۹۰). Some methodological Issues in Corpus Based Analyses of ...
Bin, H & Zhang, Y. (۲۰۱۳). Automatic Term Extraction in ...
Chujo, K., Oghigian, K., Nishigaki, C., Utiyama, M., & Nakamura, ...
Chujo, K., Nishigaki, C., & Utiyama, M. (۲۰۰۵). Selecting ۵۰۰ ...
Chujo, K., Utiyama, M., & Nakamura, T. (۲۰۰۷). Extracting Level-Specific ...
Chujo, K. (۲۰۰۴). Measuring Vocabulary Levels of English Textbooks and ...
Coxhead, A., & Nation, P. (۲۰۰۱). The specialised vocabulary of ...
Daille, B. (۱۹۹۴). Study and implementation of combined techniques for ...
Enguehard, C. & Pantera, L. (۱۹۹۵). Automatic natural acquisition of ...
Foo, J. (۲۰۱۲).Computational Terminology: Exploring Bilingual and Monolingual Term Extraction, ...
Francis, W. N. (۱۹۹۲). Language corpora BC. In Directions in ...
Frantzi, K., Ananiadou, S., & Mima, H. (۲۰۰۰). Automatic recognition ...
Gries, S. T. (۲۰۱۰). Useful statistics for corpus linguistics. A ...
Granger, S. (۲۰۱۵). The contribution of learner corpora to reference ...
Hulth, A. ( ۲۰۰۴). Combining Machine Learning and Natural Language ...
McEnery, T. (۲۰۰۱). Corpus linguistics: An introduction. Edinburgh University Press ...
Nematzadeh, Sh. (۲۰۱۳). Core Vocabulary Serving the First Grade Primary ...
Pantel, Pand. & Lin, D.(۲۰۰۱). A Statistical Corpus-Based Term Extractor. ...
Patry, A & .Langlais, P. (۲۰۰۵).Corpus-based terminology extraction. In Terminology ...
Rasooli ,M. S. & Minaei-Bidgoli, B. (۲۰۰۸). A new approach ...
Rezai, M. J. & Mosavi Miangah, T. (۲۰۱۷). FarsiTag: a ...
Sepehri ,M. (۲۰۰۶). Concordancing and its Pedagogical Implications. Language & ...
Sinclair, J. (۱۹۹۸). Corpus evidence in language description, In Gerry ...
Vulanovic, R. & Mosavi Miangah, T. (۲۰۱۸). A Comparison of ...

نمایش کامل مراجع