طراحی یک Part of Speech (POS) Taggerبراساس شبکه عصبی برای زبان فارسی

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,562

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICEE20_575

تاریخ نمایه سازی: 14 مرداد 1391

Abstract:

یکی از اجزای اصلی در سیستمهای تبدیل متن به صوت Part-of-Speech (POS) Tagging ،(TTS) است که در زبان فارسی برای تشخیص کسره اضافه نیز بکار می رود. در این مقاله از یک شبکه عصبی مصنوعی Artificial Neural Network)برایPOS Tagging در متون فارسی استفاده شده است. واژه نامه بکار رفته در این مقاله، شامل 72226 کلمه ی منحصر به فرد همراه با بردار احتمالtag آن ها است که از یک مجموعه جملات فارسی به همراه POS tag کلمات آن مجموعه، تهیه شده توسط دکتر بی جن خان و دارای تقریبا 2/6 میلیون کلمه، استخراج شده اند. شبکه عصبی استفاده شده، از نوعPerceptron و دارای 280 نرون در لایه ورودی و 40 نرون در لایه خروجی است و قابلیت تشخیص 4POS tagدر زبان فارسی را دارد. صحت این شبکه در تشخیصPOS tag کلمات موجود در متون فارسی برابر96/36%است.

Authors

بهنام رضی پرجیکلائی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران

محمد عشقی

دانشکده مهندسی برق و کامپیوتر، دانشگاه شهید بهشتی

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • _ _ _ http : //w _ _ c str.ed.ac.uk/proi ...
  • Black A W., Taylor P. A. (1997). Assigning Phrase Break ...
  • Oroumchian F, Tasharofi S., Raja F. and Rahgozar M. (2007). ...
  • Ali Azimizadeh, Mohammad Mehdi Arab, Saeid Rahati Quchani (2008). Persian ...
  • T. Brants, :TnT- a Statistical Part-of-Speech Tagger , in Proc. ...
  • M. BijanKhan, _ Role of the corpus in Writing a ...
  • Helmut Schmid, Part-of-Speech Tagging with Neural Networks, Institute for Computational ...
  • نمایش کامل مراجع