CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بهبود کیفیت و سرعت خوشه بندی صفحات وب با استفاده از نگاشت-کاهش

عنوان مقاله: بهبود کیفیت و سرعت خوشه بندی صفحات وب با استفاده از نگاشت-کاهش
شناسه ملی مقاله: PECCON01_058
منتشر شده در اولین کنفرانس ملی اصول مهندسی برق و کامپیوتر در سال 1396
مشخصات نویسندگان مقاله:

آرش پیک - گروه کامپیوتر، دانشگاه بین المللی امام رضا(ع) مشهد، ایران
عادل قاضی خانی - گروه کامپیوتر، دانشگاه بین المللی امام رضا(ع) مشهد، ایران

خلاصه مقاله:
امروزه حجم گسترده صفحات وب که معمولا به صورت خوشه بندی نشده هستند و پراکندگی و تنوع لغات درون صفحات وب که در نتیجه آن ،ایجاد داده هایی در فضای با ابعاد بالا هست، استفاده از الگوریتم های قدیمی خوشه بندی را با چالش هایی از قبیل کاهش سرعت خوشه بندی به دلیل ابعاد بالا و تعداد زیاد صفحات وب، کاهش کیفیت خوشه بندی به دلیل وجود لغات زاید و بی معنی و یا نامرتبط با محتوا و موضوع اصلی صفحه درون صفحات وب و یا چالش ایجاد خوشه هایی متفاوت اما با معنای یکسان محتوا مواجه کرده است. در روش پیشنهادی، با استفاده از نگاشت کاهشت، در دو مرحله از خوشه بندی، سرعت را افزایش می دهیم و با کمک حذف کلمات کم اهمیت و خلاصه سازی صفحات وب و در نتیجه کاهش ابعاد صفحات وب، کیفیت خوشه بندی را نیز افزایش می دهیم.

کلمات کلیدی:
خوشه بندی صفحات وب، نگاشت کاهش،

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/774111/