CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

متن کاوی متون فارسی در راستای طبقه بندی آن

عنوان مقاله: متن کاوی متون فارسی در راستای طبقه بندی آن
شناسه ملی مقاله: ICEEE04_158
منتشر شده در چهارمین کنفرانس مهندسی برق و الکترونیک ایران در سال 1391
مشخصات نویسندگان مقاله:

مریم شیخی - گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
شاهین اکبر پور - گروه علوم کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران
علی فرزان - گروه کامپیوتر، دانشگاه آزاد اسلامی واحد شبستر، شبستر، ایران

خلاصه مقاله:
امروزه با افزایش روز افزون حجم اطلاعات متنی، وجود روش های طبقه بندی متون ضروری به نظر می رسد. همچنین با رشد فزاینده ی منابع متنی فارسی این مهم بیشتر احساس می شود هر چند که هنوز کارهای صورت گرفته مخصوصاً در زمینه ی طبقه بندی متون فارسی به گستردگی لاتینی، چینی و غیره نیست. در این مقاله مروری کلی بر روش های استخراج ویژگی و انواع روش های طبقه بندی صورت گرفته و در نهایت نتایج حاصل از دو طبقه بند بیزین ساده و ماشین بردار پشتیبان با هم مقایسه می شوند. نتایج حاصل از آزمایشات صورت گرفته حاکی از این است که طبقه بندی کننده ی ماشین بردار پشتیبان از عملکرد بهتری برخوردار است.

کلمات کلیدی:
طبقه بندی متون، بردار ویژگی، ماشین بردار پشتیبان، متن کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/164235/