دسته بندی افزایشی کلان داده های اخبار وب با مدل سازی و سلسله مراتب موضوع

Publish Year: 1397
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 529

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

DESCONF01_182

تاریخ نمایه سازی: 5 آبان 1397

Abstract:

رسانه های آنلاین یکی از کانال های مهم کاربران اینترنت برای دسترسی به اخبار است. وب سایت هایخبری روزانه انبوهی از مقالات خبری را منتشر می کنند. هر روز حجم عظیمی از اخبار آنلاین تولید وبه روزرسانی می شود. پردازش و تحلیل این حجم عظیم داده ها یک چالش مهم است. این چالش باید بااستفاده از تکنیک های کلان داده ها که حجم عظیمی از داده ها را ظرف مدت زمان کوتاهی پردازشمی کنند مرتفع شود. همچنین، از آنجا که ما به سمت انفجار اطلاعات رسانه های اجتماعی می رویم،تکنیک هایی مانند متن کاوی یا تجزیه و تحلیل شبکه های اجتماعی باید جدی گرفته شود.این مقاله برروی یکی از رایج ترین کارهای رورزمره یعنی خواندن اخبار وب، تمرکز می کند. وب سایت هایخبری هزاران مقاله تولید می کنند که بازه وسیعی از موضوعات و دسته بندی ها را شامل می شود. اینمساله می تواند بعنوان یک مساله کلان داده درنظر گرفته شود. برای استخراج اطلاعات مفید، اینمقاله های خبری باید توسط تکنیک های کلان داده ها پردازش شوند. در این زمینه، یک رویکرد برای گروهبندی حجم عظیمی از مقالات خبری مختلف در دسته ها و موضوعات مختلف بر اساس محتوای آنهاارایه دادیم. چون این گروه بندی ها توسط مقالات جدید به روزرسانی می شوند، رویکرد پیشنهادی مامبتنی بر یک مدلسازی موضوعی و با استفاده از یک الگوریتم یادگیری افزایشی و سلسله مراتبی موضوعاست. روش پیشنهادی می تواند مدل توصیف کننده یک دسته را بر اساس تغییرات محتوای مقالاتمتناظر در زمان بلادرنگ به روزرسانی کند. این رویکرد با موفقیت با استفاده از اخبار آنلاین مورد ارزیابیقرار گرفته است.

Authors

سینا دامی

استادیار گروه کامپیوتر، دانشکده فنی و مهندسی، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

لیلا کاشی ها

دانشجوی کارشناسی ارشد مهندسی فناوری اطلاعات، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران