یادگیری عمیق در شناسایی موجودیت های نامدار در متون فارسی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 472

This Paper With 11 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ITCT11_027

تاریخ نمایه سازی: 18 اردیبهشت 1400

Abstract:

با توجه به وجود حجم عظیم اطلاعات غیر ساختار یافته، پردازش زبان طبیعی اهمیت ویژه ای دارد. دانش پردازش زبان طبیعی، دانشی است که بین هوش مصنوعی و زبان شناسی قرار گرفته. شناسایی موجودیت های نام دار یکی از زیرشاخه های پردازش زبان طبیعی است و نقش مهمی در انواع برنامه های پردازش زبان طبیعی مانند بازیابی اطلاعات، خلاصه سازی خودکار متن، پاسخ به پرسش، ترجمه ماشین، شناسایی نقل قول و غیره دارد. شناسایی موجودیت های نامدار به تششخیص و دسته بندی واحدهای معنادار مانند اسامی اشخاص، مکان ها، سازمان ها، زمان، تاریخ، واحد پول و درصد در متن می پردازد. در سال های اخیر پژوه های بسیاری در زمینه استفاده از شبکه های عصبی و یادگیری عمیق درشناسایی موجودیت های نامدار انجام گرفته است. در این پژوه ما با استفاده از ترکیب شبکه LSTM دو طرفه و شبکه عصبی کانولوشن، معمار ی را ارائه می دهیم که از هر دو نوع بازنمایی در سطح کلمه و نویسه به صورت خودکار بهره مند می شود. از دو پیکره برچسب خورده فارسی پیما و آرمان برای آموزش و ارزیابی مدل استفاده کرده ایم و بهترین ساختار به ترتیب ۸۹.۴% و ۹.۸۴% در سطح کلمه و عبارت برای معیار f۱ بدست آورده است.

Authors

سحر کیلانی کاظمی

دانشجوی کارشناسی ارشد، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران

رضا عزمی

دانشیار، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران