CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

برچسب زنی اجزای سخن در زبان فارسی با استفاده از شبکه عصبی کانولوشن

عنوان مقاله: برچسب زنی اجزای سخن در زبان فارسی با استفاده از شبکه عصبی کانولوشن
شناسه ملی مقاله: COMCONF07_250
منتشر شده در هفتمین کنگره ملی تازه یافته های مهندسی برق ایران در سال 1399
مشخصات نویسندگان مقاله:

عرفان رحمانی - گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران
سیامک سرمدی - استادیار گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه صنعتی ارومیه، ارومیه، ایران

خلاصه مقاله:
مشخص نمودن نقش دستوری کلمات یک جمله (برای مثال اسم، فعل و مفعول) برچسب زنی اجزای سخن نامیده می شود. ابزارهای برچسب زنی معمولا درکاربردهای مختلف پردازش زبان از جمله ترجمه ماشینی، تجزیه دستوری و اصلاح غلط های نوشتاری مورد استفاده قرار میگیرند. تحقیقات زیادی در زمینه برچسب زنی اجزای سخن در زبانهای مختلف انجام شده است ولی با توجه به متفاوت بودن قوانین دستوری و مورفولوژیکی زبان فارسی محققین این زبان، با چالش های خاصی مواجه می باشند. روش های برچسبزنی موجود از مدل های مختلف زبانی و آماری بهره برده اند. این مقاله برای دستیابی به دقت مناسب در برچسبزنی اجزای سخن، از شبکه عصبی کانولوشن CNN استفاده می نماید. مدل پیشنهادی معرفی شده، در ارزیابی انجام شده، به دقت 98/55 درصد دست یافته است.

کلمات کلیدی:
برچسب زنی اجزای سخن، تعبیه کلمات، پردازش زبان طبیعی، مجموعه نوشته

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1037892/