استفاده از خوشه بندی و خلاصه سازی اسناد جهت نمایه سازی معنایی پنهان توزیع شده
Publish place: 3rd Iran Data Mining Conference
Publish Year: 1388
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 3,619
This Paper With 10 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC03_026
تاریخ نمایه سازی: 13 دی 1389
Abstract:
نمایه سازی معنایی پنهان یک روش مفهومی در سیستم های بازیابی اطلاعات می باشد دراین روش ماتریس کلمه - سند با استفاده از روشهای وزن دهی کلمات ساخته می شود این ماتریس با روشهای تجزیه ریاضی مانند تجزیه مقادیر منفرد به یک فضای مفهومی نگاشته می شود اگر تعداد کلمات و اسناد افزایش یابد انگاه به طور فزاینده ای به درایه های ماتریس کلمه - سند افزوده می شود که باعث ایجادمشکلاتی از قبیل افزایش بسیار زیاد مصرف حافظه و هزینه های محاسباتی خواهد شد با این فرض که استفاده از توزیع اسناد باعث کاهش حافظه مورد نیاز و هزینه های اجرا می شود ما یک روش نمایه سازی معنایی پنهان را طراحی و پیاده سازی نمودیم. دراین روش با خوشه بندی اسناد و خلاصه سازی اسناد جهت بهتر شدن کارایی نیز ترکیب شده است دراین ترکیب ماتریس کلمه - سند به ازای هر خوشه دوباره ایجاد م یشود و بازیابی براساس ماتریس کلمه - سند هر خوشه انجام می گیرد ما روش ارائه شده خود را با استفاده از اسناد Hamshahri Collection که مجموعه ای از اخبار فارسی است مورد ارزیابی قرا رداده ایم ارزیابی ها نشان داد که روش ترکیبی کارایی بهتری نسبت به روش غیرترکیبی دارد.
Keywords:
Authors
مهدی به شامه
عضو هیئت علمی دانشگاه آزاد اسلامی واحد تویسرکان
حسن بشیری
عضو هیئت علمی دانشگاه صنعتی همدان