متن کاوی متون فارسی در راستای طبقه بندی آن
عنوان مقاله: متن کاوی متون فارسی در راستای طبقه بندی آن
شناسه ملی مقاله: ICEEE04_158
منتشر شده در چهارمین کنفرانس مهندسی برق و الکترونیک ایران در سال 1391
شناسه ملی مقاله: ICEEE04_158
منتشر شده در چهارمین کنفرانس مهندسی برق و الکترونیک ایران در سال 1391
مشخصات نویسندگان مقاله:
مریم شیخی - گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
شاهین اکبر پور - گروه علوم کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
علی فرزان - گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
خلاصه مقاله:
مریم شیخی - گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
شاهین اکبر پور - گروه علوم کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
علی فرزان - گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
امروزه با افزایش روز افزون حجم اطلاعات متنی، وجود روش های طبقه بندی متون ضروری به نظر می رسد. همچنین با رشد فزاینده ی منابع متنی فارسی این مهم بیشتر احساس می شود هر چند که هنوز کارهای صورت گرفته مخصوصاً در زمینه ی طبقه بندی متون فارسی به گستردگی لاتینی، چینی و غیره نیست. در این مقاله مروری کلی بر روش های استخراج ویژگی و انواع روش های طبقه بندی صورت گرفته و در نهایت نتایج حاصل از دو طبقه بند بیزین ساده و ماشین بردار پشتیبان با هم مقایسه می شوند. نتایج حاصل از آزمایشات صورت گرفته حاکی از این است که طبقه بندی کننده ی ماشین بردار پشتیبان از عملکرد بهتری برخوردار است.
کلمات کلیدی: طبقه بندی متون، بردار ویژگی، ماشین بردار پشتیبان، متن کاوی
صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/164235/