CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

پیاده سازی خزنده وب برای استخراج و تحلیل اطلاعات ۶۰ هزار آهنگ ایرانی

عنوان مقاله: پیاده سازی خزنده وب برای استخراج و تحلیل اطلاعات ۶۰ هزار آهنگ ایرانی
شناسه ملی مقاله: EECMAI02_009
منتشر شده در دومین کنفرانس بین المللی مهندسی برق، کامپیوتر، مکانیک و هوش مصنوعی در سال 1401
مشخصات نویسندگان مقاله:

سیدعلی محمدیه - گروه ریاضی محض، دانشکده علوم ریاضی، دانشگاه کاشان، کاشان، ایران

خلاصه مقاله:
در این برهه از زمان اطلاعات زیادی در شبکه جهانی وب وجود دارد و روز به روز در حال تغییر و گسترش است. هدف ما استخراج و تحلیل اطلاعات آهنگ های ایرانی است. ما با طراحی یک خزنده وب متمرکز که تنها به دنبال آهنگ ها باشد. موفق شدیم لینک صفحات وب مرتبط با اهنگ ای ایرانی را پیدا و با تحلیل آنها اطلاعات مفید آن را استخراج کنیم. در نهایت اطلاعات جمع اوری شده را ساختار یافته ذخیره و به یک بانک اطلاعاتی تبدیل کریدم این بانک اطلاعاتی شامل جزئیات بیش از ۶۰ هزار آهنگ ایرانی به همراه تصویر کاور و متن شعر و فایل های صوتی آهنگ ها در چند کیفیت می باشد. در پیاده سازی خزنده و نرم افزارها از زبان برنامه نویسی پی اچ پی و پایتون کمک گرفته شده است.

کلمات کلیدی:
خزنده وب، پردازش متن، استخراج اطلاعات، آهنگ

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1568018/