ماشین نشانه گذار با قابلیت تفکیک نشانه های ترکیبی زبان فارسی

Publish Year: 1389
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,022

This Paper With 5 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CEIC03_016

تاریخ نمایه سازی: 4 آذر 1389

Abstract:

نشانه گذاری یکی از ولین گامهای مهم برای انجام هرگونه پردازش برروی هر زبان طبیعی است وظیفه نشانه گذار جداکردن کلمات و تعیین مرز بین آنها می باشد دراین مقاله براساس ویژگیهای نوشتاری، ساختاری و معنایی زبان فارسی ماشین نشانه گذار زبان فارسی طراحی شدها ست که در دو مرحله مرز بین واژگان را تشخیص می دهد نشانه گذار سطح اول تنها براساس علایم جداکننده اصلی مانند فاصله، ویرگول و نقطه واژگان را از هم جدا میکند و نشانه گذار سطح دوم براساس ویژگی های معنایی زبان فارسی عمل می کند دراین ماشین ساختار های موجود در زبان فارسی از جمله اعداد، تاریخ و نشانه های جمع مورد بررسی قرار میگیرند. هرچند بررسی نتایج به دست امده برروی ماشینهای نشانه گذار وابسته به نوع متن و نحوه نوشتار آن است در مجموع با توجه به ساختار دو سطحی ماشین ارائه شده و بررسی اولیه صورت گرفته در سطح اول آن نتایج به دست امده در مقایسه با ماشین نشانه گذار ساده که براساس علایم جداکننده اصلی به تفکیک نشانه های زبان فارسی می پردازد همواره عملکرد بهتری دارد.

Authors

امیر ملکی انور

دانشکده کامپیوتر دانشگاه بوعلی سینا همدان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Webster, JJ. & Kit, C., Tokenization as the initial phase ...
  • Fox, C., Lexical analysis and stoplists. pp. 102-130, 1992. ...
  • Grefenstette, G & Tapanainen, P., What is a word, what ...
  • Guo, J., Critical tokenization and its properties. Computational Linguistics, 23(4), ...
  • Barcala, F.M., Vilares, J., Alonso, M.A., Graa, J. & Vilares, ...
  • Marcus Hassle, G unther Fliedl, Text Preparation through University, ...
  • Frakes, W.B. & Baeza-Yates, R., Information Retrieval: Data Structures and ...
  • Baeza-Yates, R. & Ribeiro-Neto, B., Modern Information Retrieval. Addison Wesley, ...
  • Manning, C.D. & Schitze, H., Foundations of Statistical Natural Language ...
  • K. Megerdoomian _ R. Zajac, Processing Persian Text :Tokenization in ...
  • Mohammed A. Attia School _ Informatics, Arabic Tokenization System, The ...
  • Mary Dalrympl, Maria Liakata, and Lisa Mackie, Tokenization and Morphological ...
  • Beesley KR (2001): Finite-State Morphological Analysis and Generation of Arabic ...
  • Beesley KR, Karttunen L (2003): Finite State Morphology. Stanford, Calif.: ...
  • Machine translation " Right to lett ...
  • نمایش کامل مراجع