یادگیری ماشین به ابزار فراگیری در کاربردهای محاسباتی تبدیل شده است. در عین حال، گسترش این روشها با یک ریسک بالقوه همراه است. افراد متخاصم سعی میکنند از مکانیسم یادگیری برای الزام آن به سوء رفتار یا استخراج و سوء استفاده از اطلاعات، بهرهبرداری نمایند. در این کتاب مسئله یادگیری ماشین امن معرفی میشود؛ به طور مشخص، مکانیسمهای یادگیری ماشین در فضای تخاصمی مورد بررسی قرار میگیرد. نحوه بهرهبرداری اثربخش از الگوریتمهای یادگیری موجود نشان داده شده، و در مورد الگوریتمهای جدید یادگیری ماشین مقاوم در مقابل حمله صحبت میشود. همچنین، مرزهای پایینی پیچیدگی استخراج اطلاعات از بعضی از انواع طبقهگرها از طریق کاوشهای موشکافانه نشان داده خواهد شد. این نتایج مرزهای پایینی به این معنی است که هر مکانیسم یادگیری باید از طبقهگرهای با مقداری پیچیدگی استفاده کرده، و گرنه در مقابل متعدیانی که در گریز از طبقهگرها مصمم هستند، بالقوه آسیبپذیر خواهد بود. نشان داده خواهد شد که در عین اینکه مدلهای آماری صحیح قابل ارایه بوده که مطلب قابل ملاحظهای در مورد دادههای انفرادی آموزشی بروز نمیدهند، محدودیتهای بنیادی از تضمین همزمان صیانت از حریم خصوصی و صحت، پیشگیری مینمایند.