روزانه هزاران
سند متنی تولید میشود که این اسناد و مدارک متنی یه عنوان اصلی ترین رسانه در کسب وکارها و نیز انتشار
اخبار نقش بازی میکنند. یکی از اساسی ترین محتواهایی که کاربران برای دریافت معناییخاص آن را می جویند،
اخبار است. خوشه بندی اسناد متنی باعث تقسیم مجموعه دادهها به خوشه هایکوچکتری شده که دارای شباهت داخلی بسیاری هستند و تفاوت در میان خوشه ها با هم زیاد است. خوشهبندی فازی یکی از دو رویکرد عمدهی خوشه بندی است که برای کشف مدل های فازی از داده های حجیمکاربرد دارد. برچسب زنی مانند خوشه بندی یکی از تکنیک های مدیریت داده های حجیم است که با هدف فهمموضوع و معنای کلی داده به کار میرود. هدف پژوهش حاضر، دریافت معنای چندگانه ی
اخبار متنی به زبانفارسی و الصاق برچسب معنایی بر آنها است تا بتوان اسناد متنی پردازش شده را در خوشه هایی که از نظرمعنا به برچسب ها شباهت دارند، جای داد. قلمرو داده های پژوهش مقالات فارسی زبان یک سایت خبری درطول حدود 2 سال اخیر از یکم آبان ماه 1395 تا یکم خرداد ماه 1397 می باشد. این مقالات با تعداد کلی1010046 عدد، با استفاده از کد پایتون و با فرمت Txt جمع آوری و بر روی آنها پژوهش صورت گرفت. نتایجنشان داد: متن کاوی با استفاده از ابزار برنامه نویسی پایتون و کد عاملی نرم افزاری و مدل اجرایی با دقت بالاوب معنایی، متن کاوی، داده کاوی، خوشه بندی و برچسب زنی معنایی انجام شد.