بررسی و مقایسه نرم افزارهای برچسب زنی در پایگاه داده های حجیم تصویری برای کاربردهای بینایی ماشین

Publish Year: 1401
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 187

This Paper With 12 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

این Paper در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

COMCONF09_045

تاریخ نمایه سازی: 14 آذر 1401

Abstract:

روش های یادگیری ماشین نظارت شده برای تحلیل هوشمند تصویر و فایل ویدیویی نیازمند حجم زیادی از داده های آموزشی هستند که اصطلاحا داده های برچسب دار نامیده می شوند. دیتابیس های بزرگ و برچسب دار نقش بسیار مهمی در اثبات توانمندی های الگوریتم های هوش مصنوعی در کاربردهای دنیای واقعی داشته اند و قادر هستند تا بسیاری از چالش های مربوط به پیاده سازی الگوریتم های بینایی کامپیوتری را کم کنند. ظهور الگوریتم های یادگیری عمیق برای تشخیص محتوای تصویر منجر به ظهور بسیاری از ابزارهای نرم افزاری برای نشانه گذاری یا حاشیه گذاری تصاویر (Image Annotation) شد. نشانه گذاری معمولا شامل مجموعه ای عملیات دستی توسط کاربر انسانی است و ضمن اینکه مستلزم وقت و دقت بسیار زیادی می باشد عاری از خطا هم نیست در صورت رخداد خطا در درج برچسب یا ایجاد ارتباط بین برچسب زده شده و تصاویر اصلی موجود در دیتاست عملا سیستم یادگیری با داده های غلط مواجه خواهد شد و متعاقبا دقت نهایی مدل یادگیری ماشین هم پایین خواهد آمد. لذا استفاده از ابزارهای برچسب زنی قدرتمند می توانند نقش بسزایی در کاهش زمان توسعه و ساخت پایگاه های داده بزرگ برچسب دار و با کیفیت ایفا نمایند. به علت تعدد ابزارهای موجود و کاربری متفاوت آن ها در مسائل طبقه بندی تصاویر، بخش بندی تصویر، آشکارسازی نیاز به این است که مزایا و معایب هریک از این ابزارها به خوبی مقایسه و انطباق آن ها با کاربری مدنظر در طراحی و توسعه سامانه های بینایی ماشین مشخص گردد. لذا در این تحقیق نقاط مشترک و تمایزهای بین نرم افزار برچسب زنی موجود در دست بررسی و تحلیل قرار گرفت. متعاقبا یک مرور ساختاریافته را انجام می دهیم تا مفاهیم و ویژگی های اساسی نرم افزار برچسب زنی مانند سهولت استفاده و درجه خودکارسازی را تدوین کنیم. درنهایت معیارهای مختلفی نظیر ویژگی های پایه ای، امکانات مدیریت دیتاست، فرمت های فایل های قابل پشتیبانی در نرم افزار، امنیت و مسائل دیگر را جهت مقایسه و انتخاب بهترین ابزار برای یک کاربرد خاص را ارائه می دهیم.

Keywords:

کلمات کلیدی: یادگیری ماشین , بینایی ماشین , یادگیری نظارت شده , داده های برچسب دار , تصویر , ویدیو

Authors

مهدی باحقیقت

استادیار گروه کامپیوتر، دانشگاه بین المللی امام خمینی، قزوین، ایران