روشی جدید برای خلاصه سازی چکیده تک سند فارسی با استفاده از یادگیری عمیق

الهام, یادگاری; هادی, خسروی; محمدعلی, عرب زاده

روشی جدید برای خلاصه سازی چکیده تک سند فارسی با استفاده از یادگیری عمیق

عنوان مقاله: روشی جدید برای خلاصه سازی چکیده تک سند فارسی با استفاده از یادگیری عمیق
شناسه ملی مقاله: ITCT06_032
منتشر شده در ششمین کنفرانس بین المللی فناوری اطلاعات، کامپیوتر و مخابرات در سال 1398

مشخصات نویسندگان مقاله:

الهام یادگاری - موسسه آموزش عالی صفاهان، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، اصفهان
هادی خسروی - دانشگاه شهرکرد، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، شهرکرد
محمدعلی عرب زاده - موسسه آموزش عالی صفاهان، دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر، اصفهان

خلاصه مقاله:

یکی از موضوعات مهمی که در سالهای اخیر در حوزه پردازش زبانهای طبیعی مورد توجه قرار گرفته است، سیستم های خلاصه سازی متن است. مسالهی اصلی در خلاصه سازی نگاشت دنباله هایی با طولهای نامشخص و متغیر به یکدیگر است. روشهای سنتی پردازش زبان طبیعی برای حل اینگونه مسائل دارای محدودیتهای خاص خود میباشند. از این جهت در این پژوهش تلاش شد با استفاده از روشهای جدید یادگیری عمیق، به توسعه ی مدلی مبتنی بر شبکه های عصبی بازگشتی جهت نگاشت دنباله به دنباله پرداخته شود. مدل پیاده سازی شده از روش چکیده و ابزار تنسورفلو یکی از ابزارهای یادگیری عمیق در بستر زبان برنامه نویسی پایتون استفاده کرده است. در یادگیری عمیق برای آموزش شبکه به تعداد داده های زیاد احتیاج است به همین علت جهت آموزش شبکه از مجموعه دادگانی شامل بیش از صدهزار سند خبری استفاده گردید. به منظور تطبیق داده ها با مدل از پردازش زبان طبیعی استفاده شد. نتایج پیاده سازی نشان دهنده نرخ یادآوری 19/2، دقت 10/45 و کیفیت خلاصه 13/6 است

کلمات کلیدی:

خلاصه سازی متن، پردازش زبان طبیعی، خلاصه سازی چکیده، یادگیری عمیق، مدلهای رمزگذار/رمزگشا

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/924213/