:format(webp)/nginx/o/2023/12/06/15765891t1he37b.jpg)
Tehisintellekti mudelid võivad üksteist petta, et nad eiraks oma loojaid ja annaksid keelatud juhiseid metamfetamiini valmistamiseks, pommi ehitamiseks või rahapesuks, mis viitab sellele, et selliste tehisintellektide «lahtimuukimise» ärahoidmine on keerulisem, kui tundub.
Paljudel avalikult saadavatel suurtel keelemudelitel (LLM), näiteks ChatGPT-l, on sisse kodeeritud reeglid, mille eesmärk on takistada neil väljendamast rassistlikku või seksistlikku eelarvamust või vastamast küsimustele ebaseaduslike või probleemsete vastustega – asju, mida nad on õppinud inimestelt interneti kaudu õppinud.