ارایه یک روش ترکیبی برای خوشه بندی اسناد وب با استفاده از دستهبندی کلمات کلیدی و الگوریتمK-means

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 448

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICTI01_011

تاریخ نمایه سازی: 11 مرداد 1396

Abstract:

امروزه اینترنت یکی از مهمترین منابع اطلاعاتی است که کاربران فراوانی را به خود اختصاص داده است. این کاربران، محققان و پژوهشگران و حتی عامهی مردمرا تحت پوششقرار میدهد. حجم وب بر اساس تحقیقات انجام شده، فراتر از بیلیونها صفحه است و هر لحظه میلیونها صفحه به آن افزوده میشود. ناهمگنیاسناد وب به حدی است که آشفتگی حاصل از آن غیر قابل کنترل است. محققان محیط وب این نیاز را احساس کردهاند که اگر بازیابی و سازماندهی اسناد وب هر سند وزنی داده میشود و در پایان با استفاده از روش ،K-Means اسناد را خوشهبندی میکنیم. بعد از شبیهسازی الگوریتم پیشنهادی و مقایسه ی آن با دیگر الگوریتمها، ملاحظه شد که دقت و کارایی آن نسبت به الگوریتمهای مشابه بهتر است.صورت نپذیرد، اطلاعات موجود در وب عملا غیر قابل استفاده است. لذا محققان، ایدهی ردهبندی و خوشهبندی خودکار اسناد وب را مطرح کردند، که بر اساسآن اسناد وب در یک نظام ساختارمند، سازماندهی میشوند. در این تحقیق یک روش جدید شاخصگذاری صفحات وب براساس محتوا، به منظور خوشهبندی درراستای افزایش سازماندهی اسناد وب ارایه شده است. این الگوریتم در ابتدا پارامترهای مطلوب اسناد وب را انتخاب کرده، سپس با توجه به تکنیک ارایه شده، به

Authors

امید زیارتی

دانشجوی دکتری تخصصی، گروه کامپیوتر، واحد یاسوج، دانشگاه آزاد اسلامی، یاسوج، ایران

صمد نجاتیان

عضو هیات علمی، گروه برق، واحد یاسوج، دانشگاه آزاد اسلامی، یاسوج، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • منصور مومنی؛ خوشه‌بندی داده‌ها: تحلیل خوشه‌ای، تهران، 1390. ...
  • عادل آذر و منصور مومنی؛ آمار و کاربرد آن در ...
  • J. Tukey, "Exploratory data analysis", Addis on-Wesley, 1977. ...
  • G. Ball and D. Hall, "ISODATA, A novel method of ...
  • E. Pasha and A. Fatemi, "Intuitionistic fuzzy sets clustering (IFSC) ...
  • O. Cailloux, C. Lamboray and P. Nemery, "A taxonomy of ...
  • K. Voevodski, M. Balcan, H. Roglin, S. Teng and Y. ...
  • L. Li, S. Letian, C. Shiping, L. Ming and Z. ...
  • T. Zhong, Y. Gefeng, O. Xu, and L. Zhisheng, "Application ...
  • R. Sokal and P. Sneath, "Principles of numerical taxonomy", W. ...
  • M. R. Anderberg, "Cluster analysis for applications", Academic Press, 1973. ...
  • J. A. Hartigan, "Direct clustering of a data matrix", Journal ...
  • A. K. Jain and R. C. Dube, "Algorithms for clustering ...
  • R. Duda, P. Hart and D. Stork, "Pattern c lassification, ...
  • J. Han and M. Kamber, _ Mining: Concepts and Techniques?, ...
  • P. Tan, M. Steinbach and V. Kumar, _ 'Introduction to ...
  • Bishop and M. Christopher, "Pattern recognition and machine learning", Springer, ...
  • _ Mahdavi, M. Haghir Chehreghani, H. Abolhassani, and R. Forsati, ...
  • E. Fersini, E. Messina, and F. Archetti, "A probabilistic relational ...
  • A. Ehab, R. Samhaa and E. Salwa, "A Feature Reduction ...
  • D. Napoleon and S. Pavalakodi, "A New Method for Dimen ...
  • D. Moore, and G. McCabe, "Introduction to the practice of ...
  • نمایش کامل مراجع