CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ساخت و تحلیل گراف شباهت فیلمها براساس تحلیل موضوعی زیرنویس ها

عنوان مقاله: ساخت و تحلیل گراف شباهت فیلمها براساس تحلیل موضوعی زیرنویس ها
شناسه ملی مقاله: IRANWEB08_012
منتشر شده در هشتمین کنفرانس بین المللی وب پژوهی در سال 1401
مشخصات نویسندگان مقاله:

دادفر مومنی - کارشناس مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران
حسین رحمانی - استادیار دانشکده مهندسی کامپیوتر، دانشگاه علم و صنعت ایران، تهران
محمد نظری - کارشناسی ارشد مهندسی نرم افزار، دانشگاه علم و صنعت ایران، تهران

خلاصه مقاله:
امروزه باتوجه به حجم عظیم داده ها، برای جستوجو میان آنها، ناگزیریم از روش هایی بهره بگیریم که بتوانیم اطلاعات را طبق نیازخود پالایش کنیم. این چالش در صنعت سینما و سرگرمی نیز به منظور یافتن فیلم ها و سریال هایی با موضوعات مشابه و مرتبطدرجهت پیشنهاد و کوچک کردن فضای جستوجو برای مخاطبان وجود دارد. بنابراین روش هایی لازم است که بتوانند به نحویکارآمد فیلم های مرتب و دارای موضوعات مشابه را تشخیص دهند و در اختیار کاربران بگذارند. اکثر سرویس های موجود در اینزمینه، بر اطلاعات بدست آمده از کاربران تکیه می کنند و معمولا محتوای اصلی فیلم، توسط آنها به کارگرفته نمی شود. این سرویس هااز اطلاعاتی مانند سلیقه و نظرات کاربران، یا ویژگی هایی نظیر بازیگران، کارگردان و ژانر فیلم، یا ترکیبی از این دو استفاده می کنند.در این مقاله با استفاده از ویژگی های سطح پایین استخراج شده از زیرنویس ها به تحلیل موضوعی محتوای متنی فیلم ها(زیرنویس) پرداخته ایم. به این منظور با بهره گیری از ویژگی های استخراج شده به وسیله الگوریتم LDA و سنجه شباهت کسینوسی،اقدام به ساخت گراف شباهت فیلم ها نموده ایم. در این گراف هر گره معرف یک فیلم و هر یال بیانگر شباهت میان دو فیلم است.درادامه با استفاده از روش های خوشه بندی برروی گراف فیلم ها توانستیم در خوشه ها، همبستگی موضوعی قابل توجهی میان فیلم هابدست آوریم.

کلمات کلیدی:
داده کاوی، استخراج موضوع، تحلیل گراف، فیلم، زیرنویس

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1458446/