CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یک بازنگری کلی بر الگوریتم های خلاصه سازی استخراجی

عنوان مقاله: یک بازنگری کلی بر الگوریتم های خلاصه سازی استخراجی
شناسه ملی مقاله: ICCONF01_041
منتشر شده در اولین همایش ملی کامپیوتر،فناوری اطلاعات وارتباطات اسلامی ایران در سال 1394
مشخصات نویسندگان مقاله:

یونس نوروزی - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد ایلام،
محمدرضا ولی زاد - استادیار دانشگاه آزاد اسلامی واحد ایلام

خلاصه مقاله:
دراین مقاله به بیان این می پردازیم که، خلاصه سازی خودکار متن، فرآیندی است برای کاهش حجم متن سند، با استفاده از یک سیستم کامپیوتری به منظور ایجاد خلاصه ای از متن با حفظ نکات کلیدی و مهم سند .از این رو با توجه رشد بسیار زیاد اطلاعات وداده ها ، خلاصه سازی خودکار متن، یک روش کاربردی و مورد علاقه است.این روش به کوتاه کردن محتوای اطلاعاتی یک فایل متنی با حفظ محتوای اصلی در معنای کلی اشاره می کند.خلاصه سازی چندین سند ، برایانسان کاری بسیار سخت و دشواری است . یکی از مشکلاتی که امروز وجود دارد، وجود وب سایت هایی است که باعث رشد سریع و حجم بالای اطلاعات شده اند که این امرضرورت خلاصه سازی قوی ، قدرتمند و پیچیده برای کاهش حجم اطلاعات و افزایش سرعت دسترسی را بیشتر می کند.در این مقاله سیستم های خلاصه سازی متن پس از ریشه یابی کلمات با استفاده از ترکیب روشها مبتنی بر گراف جملات را وزن دهی می نمایددر مرحله خلاصه سازی، ابتدا جملات خوشه بندی می شوند و به ازای هر خوشه جمله ای که بیشترین ارتباط باسایر جمله هارا دارد،گزینش می شود، سپس جملات برای مشمول بودن در خاصه سازی، بسته به اهمیت ارتباطی آنها انتخاب می شوند عملکرد این روش برمبنای LexRank و T-lexRank و اضافه کردن مفهوم طول جملات به آنها است.در انتها به تولید جملات خلاصه می پردازند. در انتها به بیان مزایا و معایب می پردازیم

کلمات کلیدی:
خلاصه سازی ، چند سندی ، روش استخراجی ، داده کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/408842/