یک سامانه ی نمایه گذاری چند_وزنی توزیع شده برای بهبود بازیابی اطلاعات در زبان فارسی

محدثه دانش; امید کاشفی; بهروز مینایی

یک سامانه ی نمایه گذاری چند_وزنی توزیع شده برای بهبود بازیابی اطلاعات در زبان فارسی

Publish place: 16th annual CSI Computer Conference

Publish Year: 1389

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 7 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/133890

شناسه ملی سند علمی:

CSICC16_150

تاریخ نمایه سازی: 28 بهمن 1390

Abstract:

با توجه به حجم وسیع اطلاعات و نرخ بالای پرس و جو و جریان داده کها مروزه با آن مواجه هستیم نمایه گذاری به عنوان راه حلی برای مبارزه با پیچیدگی ذاتی بازیابی متن و تسریع امر بازیابی اطلاعات درمیان شمار زیادی از زبانهای مختلف مورد توجه قرار گرفته است نمایه گذاری وب فرایند فیلتر اطلاعات دنیای وب است و نمایه گذار پالاینده اطلاعات آن . زبان فارسی یکی از پرکاربردترین زبانهای خاورمیانه است که درکشورهایی نظیر ایران افغانستان و تاجیکستان صحبت می شود بنابراین میزان زیادی از اسناد موجود در وب به زبان فارسی هستند اما متاسفانه تلاش های محدودی درزمینه بازیابی این اسناد صورت گرفته است در این مقاله راهکاری مناسب جهت بازیابی اسناد فارسی با استفاده از نمایه گذاری چند وزنی و با تکنیک توزیع شدگی ارایه شده است نمایه گذاری چند وزنی به عنوان روشی باری پاسخ گویی کاراتر به پرس وجوها مورد توجه قرار گرفته و کیفیت بازیابی اطلاعات را بطور چشمگیری افزایش میدهد.

Keywords:

بازیابی اطلاعات , ریشه یابی , نمایه گذاری , چند_وزنی , توزیع شدگی

Authors

محدثه دانش

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران

امید کاشفی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران

بهروز مینایی

دانشکده مهندسی کامپیوتر دانشگاه علم و صنعت ایران،تهران،ایران