CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

بررسی روشهای طبقه بندی خودکار اسناد متنی

عنوان مقاله: بررسی روشهای طبقه بندی خودکار اسناد متنی
شناسه ملی مقاله: ELECONFK03_098
منتشر شده در سومین کنفرانس ملی مهندسی برق و کامپیوتر سیستمهای توزیع شده و شبکه های هوشمند در سال 1395
مشخصات نویسندگان مقاله:

احسان ریحانی آرانی - دانشجوی کارشناسی ارشد،گروه کامپیوتر، دانشگاه آزاد اسلامی، واحد کاشان،
سیدمحمدرضا لاجوردی - استادیار دانشگاه،گروه کامپیوتر، دانشگاه آزاد اسلامی، واحد کاشان

خلاصه مقاله:
رشد روز افزون حجم داده های ذخیره شده در پایگاه داده ها و توسعه آنها، نیاز به ابزارهای قدرتمند و جدید جهت کشف دانش مفید از این داده ها را افزایش می دهد. از جمله داده های جمع آوری شده در این پایگا ه-داده ها، اسناد و متون الکترونیکی می باشند.بخش قابل توجهی از این اطلاعات قابل دسترس در پایگاه داده های متنی (یا پایگاه داده های سند ) که شامل مجموعه بزرگی از اسناد منابع مختلف مانند مقالات خبری، مقالات علمی، کتاب ها، ایمیل ها و صفحات وب هستند؛ ذخیره شده اند. پایگاه داده های متنی به علت افزایش مقدار اطلاعات موجود به فرم الکترونیکی سریع رشد می کنند. امروزه بیشتر اطلاعات در صنعت، کسب و کار و سازمان های علمی به صورت الکترونیکی و به فرم پایگاه داده متنی ذخیره شده اند. دسته بندی متن یکی از وظایف اساسی و مهم متن کاوی است. طبقه بندی خودکار متن یک مدل یادگیری نظارت شده است و به معنای اختصاص یک سند به برخی دسته های از پیش تعریف شده از اسناد بر اساس محتویات آنها است.

کلمات کلیدی:
متون الکترونیکی، دسته بندی اسناد، متن کاوی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/622157/