CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

مجموعه داده irBlogs جهت تحقیق درشبکه اجتماعی وبلاگهای ایرانی

عنوان مقاله: مجموعه داده irBlogs جهت تحقیق درشبکه اجتماعی وبلاگهای ایرانی
شناسه ملی مقاله: CESN01_009
منتشر شده در همایش تخصصی بررسی ابعاد شبکه های اجتماعی در سال 1392
مشخصات نویسندگان مقاله:

ابوالفضل آل احمد - دانشگاه تهران
رضا بدیع - دانشگاه تهران
مسعود رهگذر - دانشگاه تهران
بهزاد مشیری - دانشگاه تهران

خلاصه مقاله:
بارشدسریع وروزافزون تعدادکاربران اینترنت بحث شبکه های اجتماعی دروب توجه بسیاری ازمحققان درزمینه های مختلف مانند علوم کامپوزیت اقتصاداجتماعی و سیاسی را به خود جلب کرده است اما باتوجه به جدیدبودن این موضوع تاکنون تلاشهای ناچیزی درجهت ایجادمجموعه داده های استاندارد برای انجام تحقیقات دراین زمینه شده است حال آنکه وجود مجموعه داده استاندارد برای انجام هرگونه تحقیقات وحتی ارایه الگوریتم ها برای حل مسائل مختلف مهم و عدم وجود آن عاملی بسیارمحدود کننده است این مقاله به معرفی یک مجموعه داده استاندارد به نام irBlogs جهت ایجادبستری مناسب برای تحقیق و ارایه الگوریتم درزمینه شبکه های اجتماعی ایرانی می پردازد این مجموعه بسترمناسبی برای تسهیل مطالعه درزمینه شبکه های اجتماعی ایرانی خواهد بود همچنین باتوجه به اینکه این مجموعه متشکل ازوبلاگهای ایرانی است برای کاربردهای بسیاردیگری مانند بازیابی اطلاعات پردازش زبان طبیعی و مطالعه زبان فارسی استفاده زیادی خواهد داشت مجموعه irBlogs بیش از600 هزاروبلاگ شامل نزدیک به پنج میلیون پست رادرخود داردهمچنین گراف روابط افراد دراین مجموعه بیش ازپنج میلیون یال دارد

کلمات کلیدی:
مجموعه داده، شبکه اجتماعی، تئوری گراف، تحلیل شبکه اجتماعی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/225033/