بررسی جامع تهدیدات امنیتی در چرخه عمر مدل های هوش مصنوعی و راهکارهای دفاعی پیشرفته

Publish Year: 1404
نوع سند: مقاله کنفرانسی
زبان: Persian
View: 4

This Paper With 15 Page And PDF Format Ready To Download

  • Certificate
  • من نویسنده این مقاله هستم

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این Paper:

شناسه ملی سند علمی:

INDEXCONF08_039

تاریخ نمایه سازی: 20 بهمن 1404

Abstract:

گسترش سریع یادگیری عمیق و استقرار مدل های هوش مصنوعی در زیرساخت های حیاتی، این سیستم ها را به اهداف جذابی برای حملات هدفمند تبدیل کرده است. مدل های یادگیری ماشین در تمام مراحل چرخه عمر (ML Lifecycle) شامل جمع آوری و برچسب گذاری داده، آموزش، اعتبارسنجی، استقرار و استنتاج در معرض دسته های متنوعی از تهدیدات قرار دارند؛ از جمله داده آلودگی (Data Poisoning)، حملات خصمانه (Adversarial Examples)، حملات مسمومیت هدفمند (Targeted Poisoning)، استخراج مدل (Model Extraction)، سرقت پارامترها (Model Stealing)، حملات استنتاج عضویت (Membership Inference)، بازسازی داده آموزشی (Training Data Extraction) و حملات زنجیره تامین نرم افزاری AI Supply Chain Attacks. آسیب پذیری های موجود در مخازن عمومی مدل های پیش آموزش داده شده مانند Hugging Face و کتابخانه های منبع باز احتمال تزریق بک دور (Backdoor) و دستکاری وزن ها را به طور چشمگیری افزایش داده است. این مقاله ابتدا طبقه بندی جامع و به روز تهدیدات امنیتی علیه سیستم های هوش مصنوعی را ارائه می دهد سپس مکانیزم های دفاعی پیشرفته Randomized Differential Privacy, Adversarial Training, Robust Training, SMPC, Certified Defenses, Smoothing, Federated Learning, Homomorphic Encryption با تضمین حریم خصوصی، و همچنین چارچوب های امنیتی مبتنی بر Zero-Trust Architecture برای pipelineهای MLOps را بررسی می کند. تحلیل مطالعات موردی واقعی از حملات موفق مانند حمله به Microsoft Tay، حملات علیه Tesla Autopilot، و بک دورهای کشف شده در مدل های Hugging Face انجام می شود.

Keywords:

یادگیری خصمانه , امنیت زنجیره تامین هوش مصنوعی , حملات داده آلودگی , حریم خصوصی تفاضلی , هوش مصنوعی قابل اعتماد (Trustworthy AI) , معماری Zero-Trust در MLOps

Authors

حمیدرضا مختاری

دانشجوی دکتری مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد تهران، شمال، تهران ایران (نویسنده مسئول)

جواد نظریان

دانشجوی کارشناسی ناپیوسته مهندسی کامپیوتر، دانشکده ملی مهارت پسران شهر کرد، چهار محال و بختیاری ایران

جاوید مهراب ور

دانشجوی کارشناسی ناپیوسته مهندسی کامپیوتر، دانشکده ملی مهارت پسران شهر کرد، چهار محال و بختیاری ایران