CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی عناوین محتوای متنی منتشرشده در شبکه اجتماعی توئیتر

عنوان مقاله: شناسایی عناوین محتوای متنی منتشرشده در شبکه اجتماعی توئیتر
شناسه ملی مقاله: JR_CSJI-6-2_002
منتشر شده در در سال 1400
مشخصات نویسندگان مقاله:

فاطمه بهاری فرد - پژوهشکده علوم کامپیوتر، پژوهشگاه دانشهای بنیادی )IPM)
وحید معتقد - پژوهشکده علوم کامپیوتر، پژوهشگاه دانشهای بنیادی )IPM)

خلاصه مقاله:
با رشد روز افزون شبکه های اجتماعی، میل به تحلیل محتوای منتشرشده برای مقاصد گوناگون افزایش یافته است. یک دسته از عمده فعالیت هایی که در این حوزه انجام می شود شناسایی و دسته بندی محتواهای تولیدشده است. این موضوع به معنی گروه بندی مطالب منتشرشده در دسته هایی با موضوعات مشابه و ارائه برچسب های پیشنهادی برای هر دسته می باشد. در این مقاله، الگوریتم جدیدی برای دسته بندی محتوای متنی شبکه اجتماعی توئیتر ارائه شده است. در این الگوریتم ابتدا هر متن، پیش پردازش شده و سپس یک گراف ارتباطات جدید مبتنی بر محتوای متن های منتشرشده ساخته می شود. این گراف وزن دار و بی جهت است و روی آن با استفاده از دو روش بدون ناظر، تشکل های مختلف شناسایی می شوند. برای ارزیابی، داده های متنی ارسال شده از شهر واشینگتن در یک بازه زمانی، با API جمع آوری و الگوریتم های ارائه شده روی آن اعمال شده است. برای بررسی دقت، نتایج حاصل با دو الگوریتم کلاسیک K-means و LDA بر اساس معیار اطلاعات متقابل نرمال شده، مقایسه شده است که نشان دهنده دقت مناسب الگوریتم پیشنهادی است.

کلمات کلیدی:
شناسایی عنوان, گراف وزندار, یادگیری بدون ناظر, شبکههای اجتماعی, توئیتر

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1901554/