CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

متن کاوی در R با بسته tm

عنوان مقاله: متن کاوی در R با بسته tm
شناسه ملی مقاله: IDMEC01_068
منتشر شده در اولین کنفرانس ملی کسب و کارهای نوین و هوشمند داده کاوی و پردازش تصاویر در سال 1397
مشخصات نویسندگان مقاله:

سعید آریافر - دانشجوی دکتری آمار دانشگاه شهید باهنر کرمان
علیرضا عربپور - دانشیار بخش آمار دانشگاه شهید باهنر کرمان

خلاصه مقاله:
بخشی از انقلاب داده های بزرگ مربوط به رشد سریع داده های متنی، صوتی، تصویری و به طور کلی داده های بدون ساختار است. به دلیل رشد روزافزون استفاده از فضاهای مجازی و اینترنت، هر روز با داده هایی سر و کار داریم که اکثرا به شکل متن می باشند. بنابراین سازمان ها و صاحبان کسب و کارهای مختلفی نیاز به راه هایی برای یافتن اطلاعات با ارزش از داده ها و متون سازمان نیافته با استفاده از تکنیک های متن کاوی دارند. از طرفی پژوهش های کیفی مبنی بر تفسیر دادههای حاصل از نتایج مصاحبه ها، روایت های نوشته شده و دیگر متون در حال فراگیر شدن است. در این مقاله به بحث و بررسی پیرامون اهمیت متن کاوی و انجام آن با استفاده از زبان برنامه نویسی R و بسته ی tm که به صورت گسترده در متن کاوی استفاده میشود، پرداخته شد. در نهایت روش ابر کلمات به عنوان یک روش مصور سازی داده های متنی و کاربرد آن در کسب و کارهای نوین مورد بحث قرار گرفت

کلمات کلیدی:
من کاوی، داده کاوی، زبان R، بسته tm، ابر کلمات

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/990622/