با توسعه روز افزون فناوری اطلاعات و برنامه های کاربردی، اینترنت به تدریج بخشی ضروری از زندگی انسان ها شده است.صفحات وب و شبکه های اجتماعی در هر لحظه حجم عظیمی از داده های غیرساخت یافته متنی را تولید می کنند. این داده ها،رفتار و افکار مردم را نشان می دهند. واضح است تحلیل این حجم از اطلاعات کلان غیرساخت یافته کاربران، نیازمندروشهای نوین و بهینه متن کاوی و پردازش زبان طبیعی است. بررسی بازار بورس و تشخیص به موقع زمان خرید یا فروشسهام یک شرکت همواره به عنوان مشکلی بزرگ برای کسانیکه در این بازار مشغول فعالیت هستند، مطرح بوده است والبته با توجه به نوظهور بودن بازار سرمایه در ایران به جهت عدم تعمق علمی آن، گاهی اوقات زمینه های بروز بحران هایمقطعی در بورس ایران را فراهم آورده است که در این کارزار، بازندگان اصلی همان سهامداران کوچکی هستند که بهعلت ناتوانی در بررسی علمی بازار به اقداماتی نسنجیده مبادرت ورزیده و نتیجه آن تنها تقویت ناامنی و رشد ریسک دربازار سرمایه ایران بوده است و لذا پیشبینی قیمت سهام شرکتها قبل از انجام سرمایه گذاری از اهمیت فوق العاده ایبرخوردار است. در این پژوهش، نظرات کاربران از وب سایت های تحلیل بازار بورس جمع آوری شده و پس از انجامعملیات پیشپردازش بر روی آنها، مدلی طراحی شدهاست که بتواند علاوه بر مشخص نمودن نام هر سهم، وضعیت آنسهم را مشخص کرده و صعودی یا نزولی بودن
سهم را پیش بینی کند. صعودی بودن سهم، افزایش قیمت و نزولی بودن،کاهش قیمت آن
سهم را بهدنبال دارد. این مدل، یک مدل تحت نظارت SVM است که دقت بالای 95 % را روی داده های تست از خود نشان داده است.