Uitleg
AI-veiligheid omvat maatregelen om risico's van AI-systemen te minimaliseren, inclusief onbedoelde gevolgen en mogelijk gevaarlijk gedrag. Dit omvat technische veiligheid (robusteness), operationele veiligheid en langetermijnrisico's.
Areas omvatten: adversarische robuustheid, verifiabiliteit, interpretabiliteit en voorbereiding op meer geavanceerde toekomstige AI-systemen.
⚡ Voorbeelden
- •Testen op AI-robusttheid tegen adversarische aanvallen
- •Systemen ontwerpen met kill-switches voor noodsituaties
- •Onderzoek naar waarschuwingssystemen voor gevaarlijke AI-gedrag
Trefwoorden
risicorobuustheidcontrolevoorbereidingethiek