ارائه ی روشی جدید برای خزنده های داده های پیوندی در دی بی پدیا
Publish place: The first international conference of modern research engineers in electricity and computer
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 789
This Paper With 12 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
CBCONF01_0370
تاریخ نمایه سازی: 16 شهریور 1395
Abstract:
موتورهای جستجوگر برای جمع آوری محتویات صفحات وب از خزنده ها استفاده می کنند. خزنده های معمولی بدلیلرشد روز افزون داده ها و اطلاعات در وب قادر به پوشش ک صفحات نیستند. بنابراین با توجه به محدودیت منابع و زمانمی بایست از خزنده های متمرکز برای بازیابی صفحات دارای اهمیت بیشتر استفاده کرد. در وب کنونی اسناد توسط ابرمتن ها به یکدیگر لینک می شوند که بدون نوع و صرفا توسط انسان قابل تشخیص و دارای ساختار بسیار ضعیف میباشند و استخراج داده از این صفحات و کسب دانش بصورت خودکار توسط ماشین انجام پذیر نمی باشد. از چالش های پیشروی وب کنونی می توان سادگی نمایش داده های بدون ساختار و لینک های بدون نوع، عدم یکپارچگی پایگاه دادهای مختلفو نیاز اطلاعاتی کاربران به چندین پایگاه داده و همچنین پرس و جو در وب بر اساس مجموعه ای از کلید واژه ها را نام برد.در این مقاله خزش بجای اینکه بروی صفحات وب ساده انجام شود داده های پیوندی را بررسی می نماید. برای مثال دی بیپدیا که محلی از داده در دسترس برای کاربران کامپتوتر است را می توان در نظر گرفت که شامل مجموعه ای از داده هایوب در خصوص مطالب مختلف بر اساس ساختار RDF و تکنولوژی داده های پیوندی است. هدف از این مقاله پیاده سازیخزنده برای داده های پیوندی و ارزیابی روش پیشنهادی بر روی مجموعه داده دی بی پدیا است. در نتیجه محصول ماطراحی یک خزنده متمرکز مخصوص داده های پیوندی با سرعت خزش بسیار بالا می باشد.
Keywords:
Authors
حمید رستگاری
دانشکده مهندسی کامپیوتر ، واحد نجف آباد، دانشگاه آزاد اسلامی ،نجف آباد، ایران
روح الله سعیدی
کارشناس ارشد نرم افزار کامپیوتر واحد علوم و تحقیقات تهران
هادی خسروی فارسانی
عضو هیئت علمی دانشگاه شهرکرد
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :