شناسایی و ردیابی موضوع روی ویدیوهای یوتیوب با یادگیری نیمه نظارتی
Publish place: 5th International Conference on knowledge based research in Computer engineering and Information Technology
Publish Year: 1396
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 488
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCO04_030
تاریخ نمایه سازی: 17 آبان 1396
Abstract:
با رشد سریع داده های وب، مقدار زیادی از ویدیوهای وب بصورت آنلاین در دسترس هستند. هرچند، چگونگی سازمان دهی آن ها برای سهولت تجربه کاربران و نظارت دولتی، هنوز مسیله ای است که باید بطور جدی بررسی شود. شناسایی و ردیابی موضوع که برای دهه ها موضوع تحقیقاتی داغی بوده است می تواند ویدیوهای وب را در موضوعات مختلفی مطابق با محتوی معنایی آن ها خوشه بندی کند. در این میان، یوتیوب به عنوان بزرگ ترین و معروف ترین وب گاه بارگذاری و تماشای ویدیو شناخته شده است. در این مقاله، چگونگی شناسایی و ردیابی موضوع از ویدیوهای یوتیوب بطور کامل به بحث گذاشته شده است. با در دست داشتن داده های تاریخی شامل داده های برچسب خورده و بسیاری از داده های برچسب نخورده با استفاده از روش یادگیری نیمه نظارتی، ردیابی موضوعات را بدست می آوریم که می تواند موضوعات جدید را نیز از داده های جریان جدید شناسایی کند. برای این منظور، از الگوریتم یادگیری رتبه بندی لاپلاسین SVM بهره گرفته شد. انجام آزمایش ها بر روی مجموعه داده های ویدیوی دانلود شده از یوتیوب برای ارزیابی عملکرد روش پیشنهادی، نتایج سودمندی را برای شناسایی و ردیابی موضوع نشان می دهد.
Keywords:
Authors
سینا دامی
استادیار، دانشگاه آزاد اسلامی واحد تهران غرب، گروه کامپیوتر، تهران، ایران
کامران تاجیک
دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران