CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه روشی جهت برچسب گذاری اجزای واژگانی کلام در زبان فارسی

عنوان مقاله: ارائه روشی جهت برچسب گذاری اجزای واژگانی کلام در زبان فارسی
شناسه ملی مقاله: CEIT01_439
منتشر شده در اولین کنفرانس ملی نوآوری در مهندسی کامپیوتر و فنآوری اطلاعات در سال 1392
مشخصات نویسندگان مقاله:

دانیا تمدن - دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان، گروه مهندسی کامپیوتر، اهواز، ایران
محمد حسین یکتایی - استادیار دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان، گروه مهندسی کامپیوتر، اهواز ، ایران
ماشالله عباسی دزفولی - استادیار، دانشگاه آزاد اسلامی واحد علوم و تحقیقات خوزستان، گروه مهندسی کامپیوتر، اهواز، ایران

خلاصه مقاله:
یکی از کارهای اساسی در پردازش زبان طبیعی، برچسب گذاری اجزای واژگانی کلام است. کار برچسب گذار، نشانه گذاری هر لغت در متن با مناسبت ترین دسته نحوی است. در سیستم های برچسب گذار، برچسب گذاری کلمات ناشناخته و رفع ابهام از برچسب ها حائز اهمیت است و در روش پیشنهاد شده در این مقاله این دو حوزه بهبود داده شده است. داشتن یک برچسب گذار دقیق در بسیاری حوزه های اطلاعات مانند بازیابی اطلاعات، استخراج اطلاعات، سیستم تبدیل گفتار به متن، تجزیه و تحلیل زبانی وغیره کاربرد دارد. نتایج حاصل از آزمایشات انجام شده، نشان دهنده افزایش درصد درستی در برچسب گذاری لغات ناشناخته در زبان فارسی با استفاده از روش پیشنهادی در مقایسه با سایر روش های برچسب گذاری مانند برچسب گذار تریگرام و برچسب گذار تخمین احتمال بیشینه می باشد.

کلمات کلیدی:
برچست گذاری اجزای واژگانی کلام ، زبان فارسی، لغات ناشناخته

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/263036/