دسته بندی متون فارسی با استفاده از قواعدانجمنی

سیدمحمدحسین احمدی; سیدامیرحسن منجمی; سیدسعید آیت

دسته بندی متون فارسی با استفاده از قواعدانجمنی

Publish place: 3rd Iran Data Mining Conference (IDMC)

Publish Year: 1389

نوع سند: مقاله کنفرانسی

زبان: Persian

This Paper With 13 Page And PDF Format Ready To Download

دریافت فایل کامل Paper

Certificate
من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

https://civilica.com/doc/109030

شناسه ملی سند علمی:

IDMC04_032

تاریخ نمایه سازی: 15 دی 1389

Abstract:

برای دسته بندی متن از تکنیکهای استخراج اطلاعات پردازش زبان طبیعی و یادگیری ماشین بطور وسیع استفاده می شود بطور کلی هدف یک دسته بند متون دسته بندی اسناد در قالب تعداد معینی از دسته های از پیش تعیین شده می باشد هر سند می تواند در یک چند و یا هیچ دسته ای قرار بگیرد دراین تحقیق از روش دسته بندی برمبنای قواعد انجمنی که از روی فرایند کاوش الگوهای مکرر مجموعه داده های اموزشی تولید شده اند برای دسته بندی متون فارسی استفاده می شود این فرایند با فرایندی که در داده کاوی داده های بزرگ پایگاه داده ها استفاده می شود یکسان می باشد یکی از مهمترین الگوریتمهایی که برای تولید قواعد انجمنی بکار می رود الگوریتم Apriori می باشد دراین تحقیق از CBA (Classification Based on Association که برای این کار برد مناسب تشخیص داده شد استفاده شده است. برای استخراج کلمات کلیدی متون از تکنیک TFIDF و از نرم افزار قدرتمند Weka استفاده شده است.

Keywords:

طبقه بندی متون فارسی , دسته بندی متون فارسی , قواعد انجمنی , قواعد دسته بندی , استخراج کلمات کلیدی , داده کاوی متن

Authors

سیدمحمدحسین احمدی

دانشجوی کارشناسی ارشد مهندسی نرم افزار دانشگاه پیام نور واحد تهران

سیدامیرحسن منجمی

استادیار گروه مهندسی کامپیوتر دانشکده فنی مهندسی دانشگاه اصفهان

سیدسعید آیت

استادیار دانشگاه پیام نور مرکز نجف آباد