CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استفاده از پردازش زبان طبیعی برای انتخاب عنوان فارسی

عنوان مقاله: استفاده از پردازش زبان طبیعی برای انتخاب عنوان فارسی
شناسه ملی مقاله: CARSE05_230
منتشر شده در پنجمین کنفرانس بین المللی پژوهش های کاربردی در علوم و مهندسی در سال 1399
مشخصات نویسندگان مقاله:

زهرا فرید - فارغ التحصیل دانشگاه آزاد اسلامی واحد ایلام
سپیده احمدی - فارغ التحصیل دانشگاه آزاد اسلامی واحد ایلام
پریا هاشمی - فارغ التحصیل دانشگاه پیام نور تهران شمال

خلاصه مقاله:
در این مقاله دو روش جدید به منظور تعیین خودکار عنوان برای متون زبان فارسی ارائه شده است. در روش اول، ابتدا الگوهای رایج برای عناوین در متون فارسی با استفاده از یک پایگاه داده جمع آوری شده و سپس عناوین براساس موضوع متن دسته بندی می شوند. به منظور تعیین عنوان برای متون جدید، در این روش الگوهای پایگاه داده در متن ورودی جستجو می شود. سپس هر عبارت بصورت یک عنوان احتمالی درنظر گرفته می شود و با استفاده از یک معیار امتیازبندی بهترین عنوان انتخاب می شود. در روش دوم نیز تمامی عبارات اسمی با طول بیشتر از چهار کلمه از متن استخراج شده و به صورت عناوین احتمالی درنظر گرفته می شوند. در هر دو روش از یک معیار امتیاز بندی مبتنی برای تعیین میزان مناسب بودن عناوین برای متن استفاده شده است. این معیار، از دو روش TF-IDF و امتیازدهی براساس موقعیت استفاده می کند . نتایج پیاده سازی نشان میدهد که روش های پیشنهاد شده می توانند عناوین مناسبی را برای متون زبان فارسی تولید کنند.

کلمات کلیدی:
پردازش زبان طبیعی، پردازش متن، استخراج عنوان از متن، عبارت اسمی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1128574/