سیویلیکا را در شبکه های اجتماعی دنبال نمایید.

مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند

Publish Year: 1386
Type: Conference paper
Language: Persian
View: 3,726

متن کامل این Paper منتشر نشده است و فقط به صورت چکیده یا چکیده مبسوط در پایگاه موجود می باشد.
توضیح: معمولا کلیه مقالاتی که کمتر از ۵ صفحه باشند در پایگاه سیویلیکا اصل Paper (فول تکست) محسوب نمی شوند و فقط کاربران عضو بدون کسر اعتبار می توانند فایل آنها را دانلود نمایند.

Export:

Link to this Paper:

Document National Code:

ACCSI13_192

Index date: 16 November 2007

مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند abstract

در این مقاله به بررسی دستهبندی متن فارسی با استفاده از الگوریتمهایfkNN و kNN خواهیم پرداخت. آزمایشها بر روی ششصد سند متنی که به شش دسته تقسیم میشوند، انجام شدهاند. هدف اساسی این بررسی، مقایسه دو الگوریتم مذکور برای دستهبندی متن فارسی و ترکیب آنها با روشهای انتخاب ویژگی بهره اطلاعات IG و فرکانس سندDF است. از این دو روش برای انتخاب ویژگیها و کاستن از ابعاد فضای ویژگیها استفاده شده است. نتایج نشان میدهند که دقت الگوریتمfkNN از الگوریتم kNN بهتر است. همچنین دقت دستهبندی با استفاده از ترکیبIG و fkNN از سایر ترکیبها بیشتر میباشد. دقت دسته بندی در بهترین حالت به 0/804دقت میکرو- 1F و 0/755دقت ماکرو - F1 رسید . همچنین میتوان نتیجه گرفت کهIG بیشتر از DF دقت را بالا میبرد . در بین دستههای موجود بهترین دستهبندی در مورد بزرگترین دسته یعنی اسناد مربوط به دسته اقتصادی انجام گرفت. دقت دستهبندی برای این

مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند Keywords:

مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند authors

محمداحسان بصیری

گروه کامپیوتر دانشگاه اصفهان

شهلا نعمتی

دانشکده برق و کامپیوتر دانشگاه صنعتی اصفهان

ناصر قاسم آقایی

گروه کامپیوتر دانشگاه اصفهان

مراجع و منابع این Paper:

لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :
Witten, I. H., Frank, E., Data Mining: Practical Machine Learning ...
Sebastiani, F 4Machine Learning in Automated Text Categorization ", ACM ...
Lin, Y, Qu, Y, Wang, Z., "A novel feature selection ...
Tan, S., "Neighbor- weighted K-nearest Neighbor for Unbalanced Text Corpus", ...
Guyon, I., Elisseeff, A., "An introduction to variable and feature ...
Forman, G., "An extensive empirical study of feature selection metrics ...
Blum, A. L., Langley, P., "Selection of relevant features and ...
Y ang, Y, Pedersen, J. O., "A comparative study on ...
Li, B., Lu, Q.. Yu, S., *An Adaptive k-Nearest Neighbor ...
Shang, W., Huang, H., Zhu, H., & Lin, Y., "An ...
نمایش کامل مراجع

مقاله فارسی "مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند" توسط محمداحسان بصیری، گروه کامپیوتر دانشگاه اصفهان؛ شهلا نعمتی، دانشکده برق و کامپیوتر دانشگاه صنعتی اصفهان؛ ناصر قاسم آقایی، گروه کامپیوتر دانشگاه اصفهان نوشته شده و در سال 1386 پس از تایید کمیته علمی سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران پذیرفته شده است. کلمات کلیدی استفاده شده در این مقاله دستهبندی متن، انتخاب ویژگی، دسته بند kNN،(K-Nearest Neighborمدل ،(bag-of-words) BOW پیش پردازش متن هستند. این مقاله در تاریخ 25 آبان 1386 توسط سیویلیکا نمایه سازی و منتشر شده است و تاکنون 3726 بار صفحه این مقاله مشاهده شده است. در چکیده این مقاله اشاره شده است که در این مقاله به بررسی دستهبندی متن فارسی با استفاده از الگوریتمهایfkNN و kNN خواهیم پرداخت. آزمایشها بر روی ششصد سند متنی که به شش دسته تقسیم میشوند، انجام شدهاند. هدف اساسی این بررسی، مقایسه دو الگوریتم مذکور برای دستهبندی متن فارسی و ترکیب آنها با روشهای انتخاب ویژگی بهره اطلاعات IG و فرکانس سندDF است. از این ... . برای دانلود فایل کامل مقاله مقایسه دستهبندی متون فارسی با استفاده از الگوریتمهای kNN و fkNN وانتخاب ویژگیها بر اساس بهره اطلاعات و فرکانس سند با 4 صفحه به فرمت PDF، میتوانید از طریق بخش "دانلود فایل کامل" اقدام نمایید.