CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

خلاصه سازی خودکار متون فارسی با استفاده از روش های مبتنی بر گراف

عنوان مقاله: خلاصه سازی خودکار متون فارسی با استفاده از روش های مبتنی بر گراف
شناسه ملی مقاله: ICCONF04_004
منتشر شده در چهارمین کنفرانس ملی نوآوری و تحقیق در مهندسی برق و کامپیوتر و مکانیک ایران در سال 1397
مشخصات نویسندگان مقاله:

نادیا صنوبری - گروه فناوری اطلاعات موسسه آموزش عالی عبدالرحمن صوفی رازی
نگار ملکی - گروه فناوری اطلاعات موسسه آموزش عالی عبدالرحمن صوفی رازی
مجید رمضانی - گروه کامپیوتر، دانشکده برق و کامپیوتر، دانشگاه تبریز، تبریز، ایران

خلاصه مقاله:
با ر شد سریع فناوری های تبادل اطلاعات، حجم انبوهی از داده های متنی تولید می شوند که شنا سایی بهترین اسناد از نظر میزان محتوای اطلاعاتی و همچنین استخراج مهم ترین اطلاعات آنها با در نظر گرفتن زمان، بر لزوم مواجهه با سیستم های خلاصه ساز خودکارتاکید می کند. در این پژوهش یک سیمتم خلاصه سازی استاراجی تک سندی مبتنی بر گراف ارائه شده است که به دو روش اقدام به تولید خلاصه نهایی می کند؛ با این توضیح که پا از بازنمایی سند ورودی در قالب گراف جایگزین و شناسایی میزان شباهت هر یک از رئوس گراف (جملات) و انتساب وزن یال ها، در روش اول با استفاده از معیارهای تشخیص مهم ترین رئوس گراف، مهم ترین جملات برای حضور در خلا صه انتخاب می شوند. همچنین در روش دوم درخت پو شای بیشینه گراف به عنوان بخشی از گراف که در بردارنده مهم ترین ارتباطات معنایی آن است استخراج شده و مبنای انتخاب جملات برای حضور در خلاصه نهایی خواهد بود. درخت پوشای بیشینه یک زیر گراف از گراف اصلی است که بین هر راس آن فقط یک مسیر وجود دارد و مجموع وزن یال های آن بیشینه است. این پژوهش از دانش خاصی برای خلاصه سازی استفاده نمی کند و صرفا با به کارگیری صحیک ابزار مربوط به پردازش زبان طبیعی اقدام به تولید خلاصه می نماید، از این رو اینروش مناسب برای خلاصه سازی هر محتوایی می باشد

کلمات کلیدی:
خلاصه سازی خودکار متن، خلاصه استخراجی، درخت پوشای بیشینه، خلاصه سازی مبتنی بر گراف

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/865710/