خلاصه سازی متون فارسی به روش استخراجی با استفاده از گراف
Publish place: 5th National Conference on Defense Science and Engineering
Publish Year: 1398
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 607
This Paper With 26 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ECDS05_158
تاریخ نمایه سازی: 23 شهریور 1398
Abstract:
امروزه با افزایش حجم اسناد و اطلاعات متنی الکترونیکی امکان مطالعه و نگهداری آن مستلزم زمان و هزینه زیاد است، بنابراین باید بتوان مطالب مهم متون در اختیار مدیران قرار گیرد. روشهای گوناگونی برای خلاصه سازی متن وجود دارد که عموما از دو روش استخراجی و چکیدهای به این منظور استفاده میشود. در این مقاله ضمن برشمردن روشها و مجموعه های داده آماده برای زبان فارسی، به کمک نظریه گراف روشی استخراجی برای خلاصه سازی متون فارسی پیشنهاد شده است. در این روش پس از واکشی متن از مجموعه داده، جملات تفکیک شده و هر جمله به عنوان یک گره از گراف در نظر گرفته میشود. در ادامه ضمن پیش پردازش روی متن، مقدار ویژگی هر یال و گره ها محاسبه شده و بر این اساس گره ها رتبه بندی میشوند. خلاصه متن از بین گره های با امتیاز بالاتر ارائه میشود. در پایان ضمن پیاده سازی روش ارائه شده در زبان جاوا بر اساس معیارهای دقت، صحت و F-Measure روش ارائه شده مورد ارزیابی قرار گرفت که نشان از عملکرد مناسب آن دارد.
Keywords:
Authors
علیرضا صفایی
دانشجوی کارشناسی ارشد- دانشکده فناوری اطلاعات و ارتباطات - دانشگاه جامع امام حسین (ع)- تهران- ایران
محمدعلی جوادزاده
استادیار- دانشکده فناوری اطلاعات و ارتباطات - دانشگاه جامع امام حسین (ع)- تهران- ایران