استفاده از خوشه بندی و خلاصه سازی اسناد جهت نمایه سازی معنایی پنهان توزیع شده

Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 3,619

This Paper With 10 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IDMC03_026

تاریخ نمایه سازی: 13 دی 1389

Abstract:

نمایه سازی معنایی پنهان یک روش مفهومی در سیستم های بازیابی اطلاعات می باشد دراین روش ماتریس کلمه - سند با استفاده از روشهای وزن دهی کلمات ساخته می شود این ماتریس با روشهای تجزیه ریاضی مانند تجزیه مقادیر منفرد به یک فضای مفهومی نگاشته می شود اگر تعداد کلمات و اسناد افزایش یابد انگاه به طور فزاینده ای به درایه های ماتریس کلمه - سند افزوده می شود که باعث ایجادمشکلاتی از قبیل افزایش بسیار زیاد مصرف حافظه و هزینه های محاسباتی خواهد شد با این فرض که استفاده از توزیع اسناد باعث کاهش حافظه مورد نیاز و هزینه های اجرا می شود ما یک روش نمایه سازی معنایی پنهان را طراحی و پیاده سازی نمودیم. دراین روش با خوشه بندی اسناد و خلاصه سازی اسناد جهت بهتر شدن کارایی نیز ترکیب شده است دراین ترکیب ماتریس کلمه - سند به ازای هر خوشه دوباره ایجاد م یشود و بازیابی براساس ماتریس کلمه - سند هر خوشه انجام می گیرد ما روش ارائه شده خود را با استفاده از اسناد Hamshahri Collection که مجموعه ای از اخبار فارسی است مورد ارزیابی قرا رداده ایم ارزیابی ها نشان داد که روش ترکیبی کارایی بهتری نسبت به روش غیرترکیبی دارد.

Authors

مهدی به شامه

عضو هیئت علمی دانشگاه آزاد اسلامی واحد تویسرکان

حسن بشیری

عضو هیئت علمی دانشگاه صنعتی همدان