CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

انتخاب ویژگی به کمک الگوریتم ملخ جهت تحلیل احساسات در متون خبری

عنوان مقاله: انتخاب ویژگی به کمک الگوریتم ملخ جهت تحلیل احساسات در متون خبری
شناسه ملی مقاله: NCOEI01_217
منتشر شده در اولین کنفرانس مهندسی و فن آوری در سال 1399
مشخصات نویسندگان مقاله:

مهدی زاغری - گروه مخابرات، دانشکده مهندسی برق و کامپیوتر،دانشگاه آزاد اسلامی واحد یادگار امام خمینی (ره) شهر ری، تهران، ایران
سیدابوالفضل حسینی - گروه مخابرات، دانشکده مهندسی برق و کامپیوتر،دانشگاه آزاد اسلامی واحد یادگار امام خمینی (ره) شهر ری، تهران، ایران

خلاصه مقاله:
بخش اعظمی از اطلاعات که در فضای مجازی تولید و منتشر میشوند به صورت متن هستند، پردازش و ارزیابی متن از اهمیت بالایی برخوردار است. تحلیل متون برای اهداف مختلفی همانند تشخیص موضوع متن، تحلیل قطبیت و غیره مورد توجه قرار گرفته است. یکی از زمینه های مهم در تحیل متن، تحلیل معنا و به شکل خاص قطبیت آن است. تحلیل قطبیت به مفهوم درک احساس نهفته در متن است. احساس در متن به سه دسته مثبت، منفی و خنثی تقسیم می شود. در روش پیشنهادی پس از دریافت داده های خام متنی پیش پردازش روی داده ها صورت گرفت. برای پیش پردازش متن از روشهای پاکسازی و جداسازی کلمات استفاده شد. ویژگیهای مناسب بر اساس روش کیسهای از کلمات استخراج شدند. با توجه به حجم بالای ویژگیها، به کمک الگوریتم بهینه سازی ملخ ویژگیهای مناسب انتخاب شدند. برای تعیین قطبیت متن از طبقه بندهای جنگل تصافی و درخت تصمیم استفاده شد. نتایج به کمک معیارهای دقت، صحت و فراخوانی مورد بررسی قرار گرفتند. نتایج بیانگر کارایی خوب روش پیشنهادی در تشخیص قطبیت متون خبری است. هم چنین با بررسی نتایج روی داده های آموزش و آزمون، مشخص شد انتخاب ویژگی توانسته کارایی الگوریتم های طبقه بند را بهبود بخشد.

کلمات کلیدی:
متن کاوی تحلیل قطبیت، انتخاب ویژگی، درخت تصمیم، جنگل تصادفی، الگوریتم بهینه سازی ملخ

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1217911/