یادگیری عمیق در شناسایی موجودیت های نامدار در متون فارسی
Publish place: 11th International Conference on Information Technology, Computer and Telecommunications
Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 472
This Paper With 11 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ITCT11_027
تاریخ نمایه سازی: 18 اردیبهشت 1400
Abstract:
با توجه به وجود حجم عظیم اطلاعات غیر ساختار یافته، پردازش زبان طبیعی اهمیت ویژه ای دارد. دانش پردازش زبان طبیعی، دانشی است که بین هوش مصنوعی و زبان شناسی قرار گرفته. شناسایی موجودیت های نام دار یکی از زیرشاخه های پردازش زبان طبیعی است و نقش مهمی در انواع برنامه های پردازش زبان طبیعی مانند بازیابی اطلاعات، خلاصه سازی خودکار متن، پاسخ به پرسش، ترجمه ماشین، شناسایی نقل قول و غیره دارد. شناسایی موجودیت های نامدار به تششخیص و دسته بندی واحدهای معنادار مانند اسامی اشخاص، مکان ها، سازمان ها، زمان، تاریخ، واحد پول و درصد در متن می پردازد. در سال های اخیر پژوه های بسیاری در زمینه استفاده از شبکه های عصبی و یادگیری عمیق درشناسایی موجودیت های نامدار انجام گرفته است. در این پژوه ما با استفاده از ترکیب شبکه LSTM دو طرفه و شبکه عصبی کانولوشن، معمار ی را ارائه می دهیم که از هر دو نوع بازنمایی در سطح کلمه و نویسه به صورت خودکار بهره مند می شود. از دو پیکره برچسب خورده فارسی پیما و آرمان برای آموزش و ارزیابی مدل استفاده کرده ایم و بهترین ساختار به ترتیب ۸۹.۴% و ۹.۸۴% در سطح کلمه و عبارت برای معیار f۱ بدست آورده است.
Keywords:
Authors
سحر کیلانی کاظمی
دانشجوی کارشناسی ارشد، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران
رضا عزمی
دانشیار، گروه کامپیوتر، دانشکده فنی و مهندسی، دانشگاه الزهرا، تهران، ایران