ارایه روشی نوین برای دسته بندی متن بر اساس مدلی ترکیبی از روش k نزدیکترین همسایگی و الگوریتم ژنتیک

Publish Year: 1395
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 668

This Paper With 9 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

ICCSE01_039

تاریخ نمایه سازی: 14 شهریور 1396

Abstract:

در الگوریتم ژنتیک استفاده شده، فقط کلمات با بیشترین وزن بررسی نمیشوند بلکه از ترکیب بالاترین وزن ها در متن یک وزنترکیبی بهینه ارایه می کند که می تواند نوع سند (پزشکی، ورزشی، سیاسی و غیره) را مشخص کند. برای تکمیل کار الگوریتم ژنتیکخروجی آن را به الگوریتم KNN داده تا با آزمایش و آموزش بتواند طی گام های مختلفی متن های وارد شده را دسته بندی کرده و خروجی مطلوبی را به کاربر ارایه دهد. بدین منظور مساله یافتن وزن مناسب را به یک مساله بهینه سازی تبدیل کرده و به کمکالگوریتم ژنتیک به حل آن پرداخته میشود. تعریف این مساله بهینه سازی بدین صورت است که در پی یافتن تابع وزنی برایهمسایه ها با توجه به وزن نسبی آنها خواهیم بود که دقت دسته بندی را بیشینه نماید.روش پیشنهادی با ایجاد ماتریس وزن برای داده ها (هر متن یک ماتریس 1*N) نتایج بهتری را از نظر دقت و سرعت دسته بندی متنها نسبت به روشهای قبلی برای کاربر به ارمغان می آورد.تشکیل ماتریس وزن برای کلمات هر سند و تلفیق خاص الگوریتم ها باعث شده تا از ترکیب بالاترین وزنهای کلمات، یک وزن بهینهکه هم سرعت و هم دقت دستهبندی در آن لحاظ شده، پدید آید که تا 95 % از صحت کارایی نسبت به همین الگوریتم ها بدون ترکیببرخوردار می باشد.

Authors

علی رضا مشکوه روحانی

دانشجوی کارشناسی ارشد کامپیوتر نرم افزار موسسه آموزش عالی عقیق شاهین شهر

ایوب باقری

استادیار گروه مهندسی کامپیوتر دانشکده مهندسی برق و کامپیوتر دانشگاه کاشان

عاطفه جعفری نعیمی

هنر آموز آموزش و پرورش شاهین شهر