CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه چهارچوبی به منظور استخراج جایگاه برند بر مبنای متن کاوی داده های ایجاد شدهبه و سیله کاربران در شبکه اجتماعی اینستاگرام

عنوان مقاله: ارائه چهارچوبی به منظور استخراج جایگاه برند بر مبنای متن کاوی داده های ایجاد شدهبه و سیله کاربران در شبکه اجتماعی اینستاگرام
شناسه ملی مقاله: NCNIEE07_073
منتشر شده در هفتمین کنفرانس ملی ایده های نو در مهندسی برق در سال 1401
مشخصات نویسندگان مقاله:

یاسمن خرم پور - گروه فناوری اطلاعات ، موسسه آموزش عالی علوم و فناوری سپاهان، اصفهان، ایران
مهدی حمیدخانی - استادیار گروه برق، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران
سیدمحمدرضا میراحمدی - استادیار گروه مدیریت، واحد دولت آباد، دانشگاه آزاد اسلامی، اصفهان، ایران

خلاصه مقاله:
تن کاوی به عنوان یکی از بخش های مهم داده کاوی آنالیز و تجزیه و تحلیل متون مبتنی بر تکنیک های زبانشناسی، یادگیری ماشین و آمار می باشد. فرآیند خلاصه نویسی متون به شکل خودکار جهت کاهش حجم متون استفاده می شود. با توجه به رشد اطالعات و افزایش داده ها خلاصه سازی متون به شکل خودکار بسیار کاربردی و مهم است. در روش خلاصه نویسی متون به محتوای اطلاعات نباید آسیب وارد شود. فرآیند خلاصه نویسی متون فرآیندی سخت و دشوار است. یکی از چالش ها و مشکلات کارهای پیشین آسیب رساندن به محتوای اطلاعات می باشد. در روش پیشنهادی هیچ آسیبی به محتوای اطلاعات وارد نمی گردد. هدف اولیه الگوریتم پیشنهادی فرآیند ساختن یک ماتریس مجزا برای هر سند است که از کلمات تشکیل شده است. به ماتریس ساخته شده در این فرآیند، ماتریس کلمه سند گفته میشود. قبل از انجام فرآیند ساخت ماتریس کلمه سند ابتدا باید مراحلی از جمله شکست سند به جملات تشکیل دهنده ی آن، حذف ایست واژه ها و ریشه یابی کلمات اشاره نمود. روش پیشنهادی ضمن انجام فرآیند خلاصه سازی متون با استفاده از روش روش TF/IDF متون مورد بررسی را با در نظر گرفتن دو فاکتور دقت بازیابیمتون و زمان خلاصه خواهد نمود. تجزیه و تحلیل بر روی مجموعه داده های دیجی کالا نشان می دهد که تعداد ۳۸۰ نمونه را می توان در مدت زمان ۲۴۳ ثانیه و با دقت ۷۶ درصد فرآیند خلاصه نویسی و بازیابی را بر روی آن ارائه نمود. مقایسه روش پیشنهادی با سایر روشهای مطرح شده پردازش متن مانند ICO، Naive Bayes و SVM نشان میدهد که با توجه به زمان دریافتی، دقت مناسب و قابل قبولی از روش پیشنهادی میتوان انتظار داشت. روش پیشنهادی از نظر دقت نسبت به Naïve Bayes، ۱۱ درصد و نسبت به SVM، ۴ درصد بهبود را نشان می دهد.

کلمات کلیدی:
خلاصه سازی خودکار متون، الگوریتم TF/IDF، متن کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1590550/