دسته بندی متون فارسی با استفاده از شبکه عصبی و بهره گیری از الگوریتم های LDA,PCA جهت کاهش ویژگی

Publish Year: 1392
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 990

This Paper With 6 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

NCCOS02_058

تاریخ نمایه سازی: 5 مهر 1393

Abstract:

در دنیای مدرن کنونی، دستیابی به اطلاعات ارزش بالایی دارد. با افزایش حجم اطلاعات، نیاز فوقالعاده به ابزارهایی که بتوانند در جستجو، فیلترنمودن و مدیریت منابع موثر باشند، کاملاً احساس میشود. دسته بندی متون، فرآیندی است که در آن متنها در یک یا چند دسته از قبل تعریف شده براساس محتوا یا زبان نگارش متن قرار میگیرند. در این مقاله کاربرد شبکه عصبی چند لایه پرسپترون MLP در دسته بندی مستندات نیمه ساخته یافته XML بر روی پایگاه داده روزنامه همشهری بررسی شده و دستاوردهای آن مورد ارزیابی قرار گرفته است. البته برای دستهبندی مستندات با کارآیی بالا، دقت در شناسایی و انتخاب ویژگی- های مهم، نقش بسزایی دارد. به همین علت تمرکز بر روی تکنیکهای پیش پردازش مستندات و به گونه ویژه، روشهای وزندهی ویژگی مورد بررسی و تحلیل قرار گرفته و یکی از روشها TFCRF برای وزن دهی به مستنداتی که به عنوان ورودی شبکه عصبی مورد مطالعه است، بکار رفته است. در این مقاله برای استخراج بهترین ویژگیها از روش تجزیه و تحلیل مولفه های اصلی PCA با ارزیاب KNN استفاده شده و سپس نتایج آن با روش جداکننده خطی LDA ترکیب شده، در نهایت شبکه عصبی انتخاب شده مورد تست و ارزیابی قرار گرفته است. نتایج به دست آمده نشان داد که دقت دستهبندی متون فارسی با روش پیشنهادی به صورت قابل توجهی افزایش خواهد یافت

Keywords:

شبکه عصبی چند لایه پرسپترون , دسته بندی متون , وزندهی ویژگی , مستندات نیمه ساخت یافته

Authors

مهدی برفامی

دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه آزاد اسلامی بابل، ایران

سهیل فاطری

دانشکده کامپیوتر و فناوری اطلاعات، دانشگاه آزاد اسلامی بابل، ایران

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
  • مقصودی ن، همایون پور م، "ارائه روشی جدید در دسته‌بندی ...
  • Y.Yang, J. W. Wilbur, "Using CorupsStatitics Redundant Words in Text ...
  • T.M.Cover and P.E.Hart, "Nearest neighbor pattern classification, " IEEE Transaction ...
  • Y. Yang and C. G. Chute, :An example-based mapping method ...
  • symposium on document analysis and information retrieval. Las Vegas, pp. ...
  • _ Yang and X. Liu, _ Re -Examination of Text ...
  • D. D. Lewis, "Naive Bayes at forty: The independence assumption ...
  • D. _ Lewis, R. E. Schapire, J. P. Callan and ...
  • Y.Yang, J.O. Pedersen, _ Comparative Study on Feature Selection in ...
  • Information Retrieval (SIGIRO0), pp. 256-263, 2000. ...
  • J.J.Hopfield. Neurons with graded response have collective computational properties like ...
  • R. O. Duda, P. E.hart, and D. G. stork, pattern ...
  • Bishop, C. _ Pattern Recognition and Machine Learning. Springer, 2006. ...
  • S. E. Fahlman. An empirical sudy of learning speed in ...
  • J. L.McClelland and D .E.Rumelhart Parallel Distributed Processing: Exploration in ...
  • P. J. Werbos. B ackpropagation: Past and future. In Proceedings ...
  • نمایش کامل مراجع