راهکاری برای قطعه بندی بدون نظارت متن در زبان فارسی

Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 831

This Paper With 7 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NCCSE01_115

تاریخ نمایه سازی: 9 بهمن 1392

Abstract:

در این مقاله الگوریتمی برای پیدا کردن مرز بین موضوعات درون یک متن فارسی ارائه می شود که مبتنی بر انسجام کلمات و یک مدل گرافیکی با نام dotplot می باشد . سپس تغییراتی روی این الگوریتم اعمال کرده و میزان کارایی آن را افزایش داده و میانگین صحت را به مرز حدود 70 درصد می رسانیم .از طریق مشاهده نمودار و تفکیک دستی مرزهای موجود در نمودار می توان این الگوریتم را بصورت نیمه خودکار، و بااستفاده از فرمولی که در ادامه گفته می شود می توان این الگوریتم را تماماً خودکار اجرا نمود.

Authors

سلمان مختارزاده شهرکی

دانشگاه آزاد اسلامی واحد علوم و تحقیقات بوشهر

مهدی صادق زاده

عضو هیئت علمی دانشگاه آزاد اسلامی واحد ماهشهر

روح الله دیانت

عضو هیئت علمی دانشگاه قم