CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

یادگیری فعال با اسناد برچسب دار و بدون برچسب در دسته بندی متون

عنوان مقاله: یادگیری فعال با اسناد برچسب دار و بدون برچسب در دسته بندی متون
شناسه ملی مقاله: ACCSI08_018
منتشر شده در هشتمین کنفرانس سالانه انجمن کامپیوتر ایران در سال 1381
مشخصات نویسندگان مقاله:

سعید جلیلی - دانشگاه تربیت مدرس _ گروه مهندسی کامپیوتر
پریسا کردجمشیدی - دانشگاه تربیت مدرس _ گروه مهندسی کامپیوتر

خلاصه مقاله:
در بسیاری از مسائل یادگیری واقعی ، بدست آوردن نمونه های برچسب دار در مرحله آموزش بسیار پرهزینه می باشد. در این مقاله روشی برای دسته بندی متون پیشنهاد شده است که در آن ابتدا یک دسته بند بیزین ساده اولیه با تعداد کمی نمونه برچسب دار ساخته می شود، سپس با استفاده از یادگیری فعال و بکارگیری روش نمونه گیری بر اساس عدم اطمینان ب ه همراه ایده جدید مشابهت و انتخاب گروهی نمونه ها ، به صورت هدفمند نمونه های مفید را برای برچسب گذاری به کاربر می دهد تا در آموزش دسته بند از آنها استفاده کند . بدین ترتیب تعداد نمونه های برچسب دار مورد نیاز تا حد زیادی کاهش پیدا می انبوه نمونه های بدون برچسب به دسته بند EM کند. سپس با استفاده از روش داده می شوند تا به صورت خودکار برچسب گذاری شده و آموزش مجددا با مجموعه نمونه های برچسب دار و بدون برچسب صورت گیرد. در نهایت از دسته بر Boosting بند بیزین ساده ساخته شده به عنوان یک مبنا برای تشکیل کمیته اساس بیزین ساده استفاده می شود و دسته بندی نهایی با استفاده از کمیته مذکور و ترکیب آراء آنها صورت می گیرد.

کلمات کلیدی:
بیزین ساده ، یادگیری فعال ، اسناد بدون برچسب ، EM ، نمونه گیری انتخابیBoosting

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/46700/