سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

ارائه مدل دسته بندی متون فارسی با استفاده از ترکیب مدل گوسین وبیزین

Publish Year: 1398
Type: Conference paper
Language: Persian
View: 1,067

This Paper With 5 Page And PDF and WORD Format Ready To Download

Export:

Link to this Paper:

Document National Code:

SPIS05_006

Index date: 27 January 2020

ارائه مدل دسته بندی متون فارسی با استفاده از ترکیب مدل گوسین وبیزین abstract

هدف از دسته بندی اسناد، نگاشت اسناد متنی به چند دسته از قبل تعیین شده است. به دلیل رشد روز افزون متون، توجه زیادی به دسته بندی اسناد شده است. اما تجمیع نظر کارشناسان، امری چالش پذیر بوده و باعث اتلاف زمان می شود. بنابراین در سال های اخیر الگوریتم های گوناگونی برای دسته بندی خودکار اسناد، پیشنهاد شده است که البته اکثر آن ها در زمینه متون لاتین ارائه گردیده است و اخیرا به بررسی متون چینی و عربی و فارسی توجه شده است. هدف این مقاله، بررسی دسته بندی داده های فارسی می باشد که از ترکیب دو الگوریتم بیزین وگوسین، برای بهره بردن از مزیت های این دو الگوریتم، استفاده کرده ایم. در روش ارائه شده، دسته بندی متون فارسی به وسیله ی پیکره ی همشهری 2 مورد آزمایش قرار داده شده است و با روش نرمال شده ی تکرار کلمه درمعکوس تکرارسند (TF-IDF) به ویژگی ها وزن داده می شود و سپس مدل پیشنهادی پیاده سازی می شود. روش پیشنهادی برای دسته بندی این پیکره به 6 دسته، به دقت 93.04 درصد رسیده است که در مقایسه با سایر روش های ارائه شده برای متون فارسی دقت بیشتری داشته است.

ارائه مدل دسته بندی متون فارسی با استفاده از ترکیب مدل گوسین وبیزین Keywords:

دسته بندی متون فارسی , تئوری بیزین , تئوری گوسین , فرکانس کلمه و معکوس سند

ارائه مدل دسته بندی متون فارسی با استفاده از ترکیب مدل گوسین وبیزین authors

مهسا قاسمی

دانشجوی کارشناسی ارشد دانشگاه صنعتی شاهرود

فاطمه جعفری نژاد

عضو هیئت علمی دانشگاه صنعتی شاهرود

مقاله فارسی "ارائه مدل دسته بندی متون فارسی با استفاده از ترکیب مدل گوسین وبیزین" توسط مهسا قاسمی، دانشجوی کارشناسی ارشد دانشگاه صنعتی شاهرود؛ فاطمه جعفری نژاد، عضو هیئت علمی دانشگاه صنعتی شاهرود نوشته شده و در سال 1398 پس از تایید کمیته علمی پنجمین کنفرانس پردازش سیگنال و سیستم های هوشمند پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله دسته بندی متون فارسی، تئوری بیزین، تئوری گوسین، فرکانس کلمه و معکوس سند هستند. این مقاله در تاریخ 7 بهمن 1398 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 1067 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که هدف از دسته بندی اسناد، نگاشت اسناد متنی به چند دسته از قبل تعیین شده است. به دلیل رشد روز افزون متون، توجه زیادی به دسته بندی اسناد شده است. اما تجمیع نظر کارشناسان، امری چالش پذیر بوده و باعث اتلاف زمان می شود. بنابراین در سال های اخیر الگوریتم های گوناگونی برای دسته بندی خودکار اسناد، پیشنهاد شده است ... . برای دانلود فایل کامل مقاله ارائه مدل دسته بندی متون فارسی با استفاده از ترکیب مدل گوسین وبیزین با 5 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.