CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

استخراج عملکرد محل از محتواهای متنی کاربرتولید با استفاده از روش های یادگیری ماشین

عنوان مقاله: استخراج عملکرد محل از محتواهای متنی کاربرتولید با استفاده از روش های یادگیری ماشین
شناسه ملی مقاله: JR_SEPEHR-31-124_001
منتشر شده در در سال 1401
مشخصات نویسندگان مقاله:

مینا کریمی - دانشجوی دکتری، گروه مهندسی سیستم اطلاعات مکانی، دانشکده مهندسی نقشه برداری، دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران.
محمدسعدی مسگری - استادیار، گروه مهندسی سیستم اطلاعات مکانی،دانشکده مهندسی نقشه برداری - دانشگاه صنعتی خواجه نصیرالدین طوسی، تهران، ایران.

خلاصه مقاله:
امروزه با افزایش روز افزون استفاده کاربران از شبکه های اجتماعی، اطلاعات مکانی مردم ­گستر رشد چشمگیری داشته است. از میان انواع اطلاعات، محتواهای متنی کاربرتولید غالبا در ساختار مشخصی به اشتراک گذاشته نمی­ شوند. یکی از ویژگی ­های عمده این نوع اطلاعات محل­ مبنا بودن آن­ها است.محل­ های مورد گفت­گوی بشر معمولا همراه با ابهام و وابسته به بافت است. عملکرد محل یا به عبارتی عمده فعالیت ­هایی که افراد در یک محل انجام می­ دهند، به عنوان یک بافت در توصیفات محل، ازجمله ویژگی­ های عمده و متمایز­کننده محل است. هدف این تحقیق استخراج عملکرد محل با استفاده از تحلیل محتواهای متنی کاربرتولید به اشتراک گذاشته شده توسط کاربران است. به این منظور ابتدا محل­ ها و نظرات کاربران در مورد محل­ ها در وبگاه TripAdvisorبه عنوان محتواهای متنی، جمع­ آوری شده، سپس از روش ­های مختلف پردازش زبان طبیعی به منظور آماده ­سازی و پیش پردازش داده ­ها استفاده می­ شود. در ادامه برای هر دیدگاه کاربر یک مجموعه واژگان با استفاده از مقادیر TF-IDFبه عنوان مقادیر بردار ویژگی ساخته می­ شود. سپس در یک روش نظارت شده این مقادیر به همراه عملکرد محل­ هابه عنوان ورودی به یک طبقه­ بندی کننده لجستیک رگرسیون به منظور آموزش مدل داده شده و با استفاده از آن عملکرد محل بر روی داده­ های آزمایشی پیش­ بینی شده است. نتایج ارزیابی روش از طریق محاسبه ماتریس درهم­ ریختگی نشان می­ دهد، صحت کلی روش پیشنهادی در حدود ۹۶درصد است که رقم قابل توجهی است. همچنین بیشترین دقت و امتیاز F۱ برای محل­ های سرو خوراکی است، درحالی­ که اقامتگاه­ ها به دلیل شباهت عملکردی به هتل ها کمترین دقت و امتیاز F۱را دارند ولی با این وجود نتایج آن­ها نیز قابل اطمینان و رضایت ­بخش است.

کلمات کلیدی:
محل, عملکرد محل, محتواهای کاربرتولید, پردازش زبان طبیعی, یادگیری ماشین, متن

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1634008/