ارائه ی روشی جدید برای خزنده های داده های پیوندی در دی بی پدیا

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 789

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

CBCONF01_0370

تاریخ نمایه سازی: 16 شهریور 1395

Abstract:

موتورهای جستجوگر برای جمع آوری محتویات صفحات وب از خزنده ها استفاده می کنند. خزنده های معمولی بدلیلرشد روز افزون داده ها و اطلاعات در وب قادر به پوشش ک صفحات نیستند. بنابراین با توجه به محدودیت منابع و زمانمی بایست از خزنده های متمرکز برای بازیابی صفحات دارای اهمیت بیشتر استفاده کرد. در وب کنونی اسناد توسط ابرمتن ها به یکدیگر لینک می شوند که بدون نوع و صرفا توسط انسان قابل تشخیص و دارای ساختار بسیار ضعیف میباشند و استخراج داده از این صفحات و کسب دانش بصورت خودکار توسط ماشین انجام پذیر نمی باشد. از چالش های پیشروی وب کنونی می توان سادگی نمایش داده های بدون ساختار و لینک های بدون نوع، عدم یکپارچگی پایگاه دادهای مختلفو نیاز اطلاعاتی کاربران به چندین پایگاه داده و همچنین پرس و جو در وب بر اساس مجموعه ای از کلید واژه ها را نام برد.در این مقاله خزش بجای اینکه بروی صفحات وب ساده انجام شود داده های پیوندی را بررسی می نماید. برای مثال دی بیپدیا که محلی از داده در دسترس برای کاربران کامپتوتر است را می توان در نظر گرفت که شامل مجموعه ای از داده هایوب در خصوص مطالب مختلف بر اساس ساختار RDF و تکنولوژی داده های پیوندی است. هدف از این مقاله پیاده سازیخزنده برای داده های پیوندی و ارزیابی روش پیشنهادی بر روی مجموعه داده دی بی پدیا است. در نتیجه محصول ماطراحی یک خزنده متمرکز مخصوص داده های پیوندی با سرعت خزش بسیار بالا می باشد.

Authors

حمید رستگاری

دانشکده مهندسی کامپیوتر ، واحد نجف آباد، دانشگاه آزاد اسلامی ،نجف آباد، ایران

روح الله سعیدی

کارشناس ارشد نرم افزار کامپیوتر واحد علوم و تحقیقات تهران

هادی خسروی فارسانی

عضو هیئت علمی دانشگاه شهرکرد

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • Campbell G. 2011. RDA and rd: a discourse analysis of ...
  • Khosravi H 2010 Entity ranking in web of data. The ...
  • Heath, T.; An Introduction to Linked Data, Slides, Austin, Texas, ...
  • Gerber A, Barnard A, Joanna A. 2007. Towards a semantic ...
  • S. Chakrabarti, M.V.D. Berg, B.Dom, "Focused crawling: a new approach ...
  • Am sterdam , Netherlands , pp. 1623- 1640, 1999 ...
  • B. Pinkerton, "Finding what people want: experiences with the web ...
  • A. Rungsawang, N. Angkaw attanawit, "Learnable topic-specific web crawler, " ...
  • Salton, G.(1991) Developments in Automatic Text Retrieval, Science, 253 , ...
  • نمایش کامل مراجع