روشی جدید برای خوشه بندی مستندات متنی فارسی براساس آنتولوژی
Publish place: National Conference on Computer Science and Engineering
Publish Year: 1391
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 835
This Paper With 5 Page And PDF Format Ready To Download
- Certificate
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
NCCSE01_122
تاریخ نمایه سازی: 9 بهمن 1392
Abstract:
در دنیای امروزی بسیاری از اطلاعات به صورت انواع مختلفی از متون الکترونیکی ذخیره می شوند. جهت استخارج دانش از این متون، نیاز به سیستم های خوشه بندی خودکار است. با وجود رشد منابع اطلاعاتی فارسی، متأسفانه در حوزه خوشه بندی متون فارسی کارهای زیادی صورت نگرفته است. بیشترین تحقیقات انجام گرفته در این زمینه، مربوط به متون انگلیسی هستند که معمولاً قابل استفاده برای متون فارسی نیستند. بنابراین فقدان یک سیستم خوشه بندی کارآمد برای متون فارسی مشهود است. هدف این مقاله ارائه یک سیتستم برای خوشه بندی مفهومی متون فارسی می باشد که بتواند کیفیت خوشه بندی متون فارسی را بهبود ببخشد. در این مقاله دو راه ار جدید براساس آنتولوژی برای بهبود خوشه بندی مستندات فارسی ارائه شده است. نتایج تجربی حاصل از اجرای راهکارهای پیشنهادی روی 15 مجموعه داده انتخاب شده از متون همشهری، حاکی از بهبود کیفیت خوشه بندی نسبت به روشهای معمول است.
Keywords:
آنتولوژی , خوشه بندی مستندات فارسی
Authors
ابوالفضل ولیزاده
دانشگاه آزاد اسلامی واحد شبستر
روح الله اعتمادی
دانشگاه آزاد اسلامی واحد بناب
شاهین اکبرپور
دانشگاه آزاد اسلامی واحد شبستر
مراجع و منابع این Paper:
لیست زیر مراجع و منابع استفاده شده در این Paper را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود Paper لینک شده اند :