سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

استفاده از شبکه های عصبی CC4 برای رده بندی اسناد فارسی

Publish Year: 1387
Type: Conference paper
Language: Persian
View: 1,548

This Paper With 7 Page And PDF Format Ready To Download

Export:

Link to this Paper:

Document National Code:

IDMC02_072

Index date: 3 April 2009

استفاده از شبکه های عصبی CC4 برای رده بندی اسناد فارسی abstract

در این مقاله رده بندی اسناد و متون فارسی با استفاده از شبکه عصبی CC4 پیشنهاد شده است. CC4 یک نوع از الگوریتم یادگیری رده بندی کناره ای برای شبکه های سه لایه رو به جلو می باشد. از مهمترین مزایای استفاده از این شبکه ها می توان به غیرتکراری بودن این نوع شبکه در مرحله آموزش اشاره کرد. افزایشی بودن مرحله آموزش مزیت دیگری است که استفاده از این شبکه را برای رده بندی اسناد حجیم فارسی مناسب می کند. در واقع اضافه نمودن داده های آموزشی جدید به شبکه CC4 بهسادگی امکان پذیر است. همچنین، اگر مقیاس بین فایل های متنی نزدیک به هم باشد، شبکه عصبی CC4 نتایج رده بندی بهتری را ارائه می دهد. در این مقاله ابتدا پیش پردازش های ریشه یابی کلمات و حذف کلمات عمومی 1 انجام می گیرد. سپس ویژگی های آماری برای کلمات مختلف محاسبه شده و از یک روش مبتنی بر فراوانی کلمات برای نمایه گذاری اسناد استفاده می شود که اسناد با انداره های متفاوت را به یک فضای K بعدی با اندازه ثابت نگاشت می کند. با اعمال استخراج ویژگی های مناسب و تغییراتی که در این الگوریتم اعمال کرده ایم، توانسته ایم دقت این رد ه بند را روی متون فارسی بهبود دهیم. برای آزمایش این روش از مجموعه اخبار خبرگزاری ایسنا استفاده شده است. این پیکره شامل تعداد 9000 سند فارسی می باشد. رده های موجود در این پیکره شامل سیاسی، اجتماعی، فرهنگی و ورزشی است. با به کارگیری روش پیشنهادی ، اسناد پیکره با دقت حدود 90 % رده بندی شدند

استفاده از شبکه های عصبی CC4 برای رده بندی اسناد فارسی Keywords:

استفاده از شبکه های عصبی CC4 برای رده بندی اسناد فارسی authors

مقاله فارسی "استفاده از شبکه های عصبی CC4 برای رده بندی اسناد فارسی" توسط مسلم محمدی؛ بهروز مینایی بیدگلی؛ مرتضی آنالویی نوشته شده و در سال 1387 پس از تایید کمیته علمی دومین کنفرانس داده کاوی ایران پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله شبکه های عصبی، رده بندی اسناد، رده بند کناره ای، متون فارسی هستند. این مقاله در تاریخ 14 فروردین 1388 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 1548 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که در این مقاله رده بندی اسناد و متون فارسی با استفاده از شبکه عصبی CC4 پیشنهاد شده است. CC4 یک نوع از الگوریتم یادگیری رده بندی کناره ای برای شبکه های سه لایه رو به جلو می باشد. از مهمترین مزایای استفاده از این شبکه ها می توان به غیرتکراری بودن این نوع شبکه در مرحله آموزش اشاره کرد. ... . برای دانلود فایل کامل مقاله استفاده از شبکه های عصبی CC4 برای رده بندی اسناد فارسی با 7 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.