سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور

Publish Year: 1396
Type: Conference paper
Language: Persian
View: 812

This Paper With 15 Page And PDF and WORD Format Ready To Download

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

Export:

Link to this Paper:

Document National Code:

CITCOMP02_259

Index date: 26 February 2018

سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور abstract

اغلب عملیات پردازش متن احتیاج به مرحله پیش پردازش دارد. دقت عملیات مختلف به دقت این ابزار پیش-پردازش وابستگی زیادی دارد. پیش پردازش ممکن است فقط شامل اصلاح و یکسان سازی نویسه ها باشد و یا اعمال پیچیده تری همچون واژه بندی، اصلاح نیم فاصله ها، ریشه یابی، بن یابی و غلط یابی را انجام دهند. هدف از پژوهش حاضر ارایه یک ابزار یکسان سازی و واژه بندی دقیق تر و جامع تر از ابزارهای موجود و مناسب برای مرحله پیش پردازش ابزار تجزیه گر سازه است. تجزیه گر سازه بر روی درخت بانک سازه آموزش داده شده است. واژه بندی درست و مطابق با شیوه-نامه استفاده شده در درخت بانک سازه تاثیر به سزایی در دقت عملیات تجزیه خواهد داشت. سازه پرداز ابزار ارایه شده در این مقاله است که برخلاف روش های رایج که مبتنی بر قانون و لغت نامه هستند از روش های پیکره محور برای این منظور استفاده می کند. عملیات اصلاح نیم فاصله ها، اصلاح صفت های مفعولی افعال مرکب و جداسازی واژه بست ها در ابزار ارایه-شده وجود دارد. ارزیابی ابزار پیش پردازش حاضر بر روی مجموعه 100 جمله نمونه، معیار F معادل 90.4% را نشان می دهد..

سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور Keywords:

سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور authors

شهره طباطبایی سیفی

پژوهشگر ارشد، گروه صوت و پردازش زبان طبیعی، پژوهشگاه خواجه نصیرالدین طوسی، تهران، ایران

ایمان صراف

پژوهشگر ارشد، پژوهشگاه خواجه نصیرالدین طوسی

مقاله فارسی "سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور" توسط شهره طباطبایی سیفی، پژوهشگر ارشد، گروه صوت و پردازش زبان طبیعی، پژوهشگاه خواجه نصیرالدین طوسی، تهران، ایران؛ ایمان صراف، پژوهشگر ارشد، پژوهشگاه خواجه نصیرالدین طوسی نوشته شده و در سال 1396 پس از تایید کمیته علمی دومین کنفرانس بین المللی پژوهش های دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله پردازش زبان طبیعی، پیش پردازش، پیکره زبانی، یادگیری ماشین هستند. این مقاله در تاریخ 7 اسفند 1396 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 812 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که اغلب عملیات پردازش متن احتیاج به مرحله پیش پردازش دارد. دقت عملیات مختلف به دقت این ابزار پیش-پردازش وابستگی زیادی دارد. پیش پردازش ممکن است فقط شامل اصلاح و یکسان سازی نویسه ها باشد و یا اعمال پیچیده تری همچون واژه بندی، اصلاح نیم فاصله ها، ریشه یابی، بن یابی و غلط یابی را انجام دهند. هدف از پژوهش حاضر ... . این مقاله در دسته بندی موضوعی یادگیری ماشین و پردازش زبان طبیعی طبقه بندی شده است. برای دانلود فایل کامل مقاله سازه پرداز: واژه بندی و یکسان سازی متون فارسی با رویکرد پیکره - محور با 15 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.