یادگیری عمیق در شناسایی موجودیت های نامدار در متون فارسی

سحر کیلانی کاظمی; رضا عزمی

یادگیری عمیق در شناسایی موجودیت های نامدار در متون فارسی

Publish place: 11th International Conference on Information Technology, Computer and Telecommunications

Publish Year: 1399

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 11 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/1197095

شناسه ملی سند علمی:

ITCT11_027

تاریخ نمایه سازی: 18 اردیبهشت 1400

Abstract:

با توجه به وجود حجم عظیم اطلاعات غیر ساختار یافته، پردازش زبان طبیعی اهمیت ویژه ای دارد. دانش پردازش زبان طبیعی، دانشی است که بین هوش مصنوعی و زبان شناسی قرار گرفته. شناسایی موجودیت های نام دار یکی از زیرشاخه های پردازش زبان طبیعی است و نقش مهمی در انواع برنامه های پردازش زبان طبیعی مانند بازیابی اطلاعات، خلاصه سازی خودکار متن، پاسخ به پرسش، ترجمه ماشین، شناسایی نقل قول و غیره دارد. شناسایی موجودیت های نامدار به تششخیص و دسته بندی واحدهای معنادار مانند اسامی اشخاص، مکان ها، سازمان ها، زمان، تاریخ، واحد پول و درصد در متن می پردازد. در سال های اخیر پژوه های بسیاری در زمینه استفاده از شبکه های عصبی و یادگیری عمیق درشناسایی موجودیت های نامدار انجام گرفته است. در این پژوه ما با استفاده از ترکیب شبکه LSTM دو طرفه و شبکه عصبی کانولوشن، معمار ی را ارائه می دهیم که از هر دو نوع بازنمایی در سطح کلمه و نویسه به صورت خودکار بهره مند می شود. از دو پیکره برچسب خورده فارسی پیما و آرمان برای آموزش و ارزیابی مدل استفاده کرده ایم و بهترین ساختار به ترتیب ۸۹.۴% و ۹.۸۴% در سطح کلمه و عبارت برای معیار f۱ بدست آورده است.

Keywords:

شناسایی موجودیت های نامدار , پردازش زبان طبیعی , زبان فارسی , شبکه بازگشتی , شبکه عصبی کانولوشن

Authors

سحر کیلانی کاظمی

دانشجوی کارشناسی ارشد، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران

رضا عزمی

دانشیار، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران