بررسی نقش برچسبزنی کلمات در نمایهسازی و دقت بازیابی برای اسناد و پرسوجوهای فارسی
Publish place: 2nd Iran Data Mining Conference
Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,762
متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دریافت نمایند.
- Certificate
- من نویسنده این مقاله هستم
این Paper در بخشهای موضوعی زیر دسته بندی شده است:
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
IDMC02_048
تاریخ نمایه سازی: 14 فروردین 1388
Abstract:
بررسی تاثیر برچسبزنی کلمات و تعیین ادات سخن بر کارایی و دقت بازیابی و همچنین حجم نمایه سیست م های بازیابی اطلاعات یکی از مباحث داغ در زمینه پردازش زبانهای طبیعی میباشد. تحقیقات گوناگونی تاکنون در زبان انگلیسی جهت بررسی نقشِ ادات سخن و اهمیت آن در حجمِ نمایه و دقت بازیابی صورت گرفته است. در این نوشتار برآنیم تا با برچسبزنی خودکار اسناد پیکره همشهری، بعنوان بزرگترین پیکره استاندارد فارسی، نقش هر یک از ادات سخن را در حجمِ نمایه و همچنین دقت بازیابی بررسی نماییم. برای این منظور ابتدا پیکره همشهری برچسبگذاری شده و سپس از پیکره برچسبگذاری شده جهت تعیین نقش هر برچسب در بازیابی اسناد و پرسوجوهای فارسی استفاده شده است. نتیجه این تحقیق، زمینهساز بسیاری از پژوهشها در حوزه- ی بازیابی اطلاعات فارسی با رویکرد زبانشناسی خواهد بود
Keywords: