CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بازنگری کلی بر الگوریتم حداکثر ارتباط حاشیه ای mmr درخلاصه سازی چند سندی

عنوان مقاله: بازنگری کلی بر الگوریتم حداکثر ارتباط حاشیه ای mmr درخلاصه سازی چند سندی
شناسه ملی مقاله: ICCONF01_043
منتشر شده در اولین همایش ملی کامپیوتر،فناوری اطلاعات وارتباطات اسلامی ایران در سال 1394
مشخصات نویسندگان مقاله:

یونس نوروزی - دانشجوی کارشناسی ارشد دانشگاه آزاد اسلامی واحد ایلام،
محمدرضا ولی زاد - استادیار دانشگاه آزاد اسلامی واحد ایلام

خلاصه مقاله:
دراین مقاله به بیان این می پردازیم که امروزه باتوجه به گسترش اینترنت و افزایش حجم اطلاعات دردسترس که بیشتر این اطلاعات براساس متن هستند کاربران بایک جستجوی ساده انبوهی ازمتن را دریافت می کنند که خواندن همه آنها زمان زیادی را نیاز دارد ازاین رو سامانه استخراج اطلاعات ازاهمیت خاصی برخوردار است اما ازآن مهمترسامانه ی است که بتواند خلاصه سازی متن را انجام دهد ازاین رو خلاصه سازی متن اهمیت پیدا می کند خلاصه سازی متن عبارت است ازخلاصه کردن متن اصلی به یک متن یا نسخه کوتاه تر به صورت ی که اطلاعات و محتوا و معنای کلی آن حفظ شود و این امر برای افراد کاری بسیارسخت و دشوار است که بتواند اسنادوداده های بزرگ موجود درمتن را به صورت دستی خلاصه سازی نماید دوروش اصلی خلاصه سازی : 1-خلاصه سازی تک سند/خلاصه سازی چندسند یکی از مشکلاتی که امروز وجود دارد، وجود وب سایت هایی است که باعث رشد سریع و حجم بالای اطلاعات شده اند که این امرضرورت خلاصه سازی قوی ، قدرتمند و پیچیده برای کاهش حجم اطلاعات و افزایش سرعت دسترسی را بیشتر می کند.در این مقاله سیستم های خلاصه سازی متن پس اریشه یابی کلمات بااستفاده ازترکیبات روشها مبتنی برگراف جملات را وزن دهی مینماید درمرحله خلاصه سازی ابتدا جملات خوشه بندی می شوند و به ازای هرخوشه جمله ای که بیشترین ارتباط با سایرجمله ها را دارد گزینش میشود سپس جملات برای مشمول بودن درخاصه سازی بسته به اهمیت ارتباطی آنها انتخاب میشوند عملکرد این روش برمبنای LexRank و T-lexRank و اضافه کردن مفهوم جملات به آنها است

کلمات کلیدی:
خلاصه سازی ، mmr ،چند سندی ، چند سندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/408844/