استفاده از پردازش زبان طبیعی برای انتخاب عنوان فارسی

Publish Year: 1399
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 561

This Paper With 28 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CARSE05_230

تاریخ نمایه سازی: 17 آذر 1399

Abstract:

در این مقاله دو روش جدید به منظور تعیین خودکار عنوان برای متون زبان فارسی ارائه شده است. در روش اول، ابتدا الگوهای رایج برای عناوین در متون فارسی با استفاده از یک پایگاه داده جمع آوری شده و سپس عناوین براساس موضوع متن دسته بندی می شوند. به منظور تعیین عنوان برای متون جدید، در این روش الگوهای پایگاه داده در متن ورودی جستجو می شود. سپس هر عبارت بصورت یک عنوان احتمالی درنظر گرفته می شود و با استفاده از یک معیار امتیازبندی بهترین عنوان انتخاب می شود. در روش دوم نیز تمامی عبارات اسمی با طول بیشتر از چهار کلمه از متن استخراج شده و به صورت عناوین احتمالی درنظر گرفته می شوند. در هر دو روش از یک معیار امتیاز بندی مبتنی برای تعیین میزان مناسب بودن عناوین برای متن استفاده شده است. این معیار، از دو روش TF-IDF و امتیازدهی براساس موقعیت استفاده می کند . نتایج پیاده سازی نشان میدهد که روش های پیشنهاد شده می توانند عناوین مناسبی را برای متون زبان فارسی تولید کنند.

Keywords:

Authors

زهرا فرید

فارغ التحصیل دانشگاه آزاد اسلامی واحد ایلام

سپیده احمدی

فارغ التحصیل دانشگاه آزاد اسلامی واحد ایلام

پریا هاشمی

فارغ التحصیل دانشگاه پیام نور تهران شمال