ارایه یک روش ترکیبی برای خوشه بندی اسناد وب با استفاده از دستهبندی کلمات کلیدی و الگوریتمK-means
Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 448
This Paper With 6 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
ICTI01_011
تاریخ نمایه سازی: 11 مرداد 1396
Abstract:
امروزه اینترنت یکی از مهمترین منابع اطلاعاتی است که کاربران فراوانی را به خود اختصاص داده است. این کاربران، محققان و پژوهشگران و حتی عامهی مردمرا تحت پوششقرار میدهد. حجم وب بر اساس تحقیقات انجام شده، فراتر از بیلیونها صفحه است و هر لحظه میلیونها صفحه به آن افزوده میشود. ناهمگنیاسناد وب به حدی است که آشفتگی حاصل از آن غیر قابل کنترل است. محققان محیط وب این نیاز را احساس کردهاند که اگر بازیابی و سازماندهی اسناد وب هر سند وزنی داده میشود و در پایان با استفاده از روش ،K-Means اسناد را خوشهبندی میکنیم. بعد از شبیهسازی الگوریتم پیشنهادی و مقایسه ی آن با دیگر الگوریتمها، ملاحظه شد که دقت و کارایی آن نسبت به الگوریتمهای مشابه بهتر است.صورت نپذیرد، اطلاعات موجود در وب عملا غیر قابل استفاده است. لذا محققان، ایدهی ردهبندی و خوشهبندی خودکار اسناد وب را مطرح کردند، که بر اساسآن اسناد وب در یک نظام ساختارمند، سازماندهی میشوند. در این تحقیق یک روش جدید شاخصگذاری صفحات وب براساس محتوا، به منظور خوشهبندی درراستای افزایش سازماندهی اسناد وب ارایه شده است. این الگوریتم در ابتدا پارامترهای مطلوب اسناد وب را انتخاب کرده، سپس با توجه به تکنیک ارایه شده، به
Keywords:
Authors
امید زیارتی
دانشجوی دکتری تخصصی، گروه کامپیوتر، واحد یاسوج، دانشگاه آزاد اسلامی، یاسوج، ایران
صمد نجاتیان
عضو هیات علمی، گروه برق، واحد یاسوج، دانشگاه آزاد اسلامی، یاسوج، ایران
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :