شناسایی و دسته بندی نظام مند ویژگیهای علمی و فنی دانشنامه چندزبانه ویکی پدیا به عنوان یک پایگاه دانش غنی درحوزه ی داده کاوی

Publish Year: 1387
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 1,539

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

IDMC02_038

تاریخ نمایه سازی: 14 فروردین 1388

Abstract:

ویکی پدیا بعنوان بزرگترین دانش نامه ی چندزبانه ی آزاد دنیا که توسط میلیون ها نفر در سرتاسر جهان به روز رسانی و نگهداری می شود در سالهای اخیر توجه تعداد زیادی از محققان را در حوزه های مختلفی مانند پردازش زبان طبیعی، داده کاوی و بازیابی اطلاعات به خود جلب نموده است و به عنوان یکی از مهمترین منابع اطلاعاتی در حوزه های پیش گفته مطرح می باشد. علت این امر را می توان در کیفیت بالای متن مقالات لینک های ارتباطی غنی میان آنها و حجم بسیار زیاد مقالات دانست. با وجود رشد چشمگیر ویکی پدیا و محتوای معنایی غنی آن، تاکنون تلاش موثری جهت معرفی ویژگی های علمی و فنی آن به شکلی نظام مند و مطالعه تحلیلی پژوهش های انجام شده در این حوزه انجام نگرفته است و پژوهشگران مختلف هر کدام سعی در استفاده از بخشی از محتوا و امکانات ویکی پدیا بسته به علایق کاری و سلایق خود نموده اند. در این پژوهش ضمن تحلیل و ارزیابی تحقیقات پیشین صورت گرفته روی منبع داده ی ویکی پدیا در حوزه ی پردازش زبان طبیعی، داده کاوی و بازیابی اطلاعات، خصوصیات و ویژگیهای علمی و فنی ویکی پدیا به شکلی نظام مند شناسایی و معرفی می شود. همچنین در این مقاله نقش وجایگاه هر یک از ویژگیهای مذکور در حوزه های کاربردی مختلف تبیین می گردد. نتیجه این تحقیق بسترساز استفاده موثر و علمی از ویکی پدیا، به عنوان یکی از غنی ترین منابع اطلاعاتی در حوزه داده کاوی می باشد. براین اساس زمینه مناسبی جهت مقایسه فنی میان روشهای مختلف داده کاوی بهسازی روشهای مختلف داده کاوی از طریق شناخت نقاط ضعف و قوت آنها و حتی ارائه روشهای کامل تر در حوزه داده کاوی فراهم می شود.