Anthropics Claude Mythos Preview er blevet den første AI-model, der har gennemført et fuldt simuleret angreb på et virksomhedsnetværk, ifølge nye evalueringer fra Storbritanniens AI Security Institute (AISI).
Resultaterne, som blev offentliggjort få dage efter modellens lancering den 7. april, antyder, at AI’s cyber-evner nu er på et niveau, der kræver omgående opmærksomhed fra sikkerhedsteams verden over.
Hvad er Claude Mythos?
Anthropic præsenterede sin Claude Mythos Preview-model den 7. april, men valgte ikke at lancere den bredt offentligt. Teamet giver i stedet begrænset adgang til sikkerhedsresearch-firmaer for at teste og forberede sig på modellens avancerede egenskaber.
“Denne model præsterer stærkt på alle områder, men den er særligt dygtig til computersikkerhedsopgaver. Derfor har vi lanceret Project Glasswing, hvor vi vil bruge Mythos Preview til at styrke sikkerheden i verdens mest kritiske software samt forberede branchen på de metoder, vi alle skal tage i brug for at holde os foran cyberangribere,” lød meddelelsen.
Følg os på X for at få de seneste nyheder i realtid
Udviklingen har allerede fanget opmærksomhed i både tech- og politiske kredse. Ifølge Reuters, som citerer kilder tæt på sagen, afholdt den amerikanske finansminister Scott Bessent og centralbankens chef Jerome Powell et hastemøde med de største bankdirektører, hvor de advarede om potentielle cyberrisici forbundet med denne model.
Sådan præsterede Claude Mythos Preview
AI Security Institute (AISI), en forskningsorganisation under Storbritanniens Department for Science, Innovation and Technology, testede Cyber-evnerne hos Anthropics Claude Mythos Preview for at undersøge dens cybersikkerhed.
Først var det capture-the-flag (CTF)-evalueringer, hvor systemer skal finde og udnytte sårbarheder for at hente skjulte “flag”. Mythos opnåede en succesrate på 73% i avancerede opgaver. Det havde ingen model klaret før april 2025.
Derudover udviklede AISI en 32-trins simuleret angreb på et virksomhedsnetværk kaldet “The Last Ones” (TLO). Sikkerhedsfolk ville normalt bruge cirka 20 timer på at gennemføre det.
Mythos Preview fuldførte hele simuleringen i 3 ud af 10 forsøg. I snit klarede den 22 af de 32 angrebstrin. Claude Opus 4.6, der præsterede næstbedst, klarede gennemsnitligt kun 16 trin.
“Mythos Previews succes på en cyberrange viser, at modellen mindst kan angribe små, dårligt beskyttede og sårbare virksomhedssystemer selvstændigt, når der er adgang til et netværk. Men vores ranges adskiller sig væsentligt fra virkeligheden og er lettere mål,” tilføjede teamet.
Anthropics interne red team-test afslørede, at Claude Mythos Preview kan opdage og udnytte zero-day sårbarheder på alle større styresystemer og populære webbrowsere, når brugere instruerer modellen direkte.
“Vi er begrænset i, hvor meget vi kan fortælle her. Over 99% af de sårbarheder, vi har opdaget, er endnu ikke blevet lappet, så det ville være uansvarligt at offentliggøre detaljer om dem,” sagde teamet.
AISI bemærkede, at organisationer bør prioritere grundlæggende cybersikkerhedsforanstaltninger. Det indebærer regelmæssig patching, stramme adgangskontroller, sikker konfiguration og grundig logning.
Tilmeld dig vores YouTube-kanal og se eksperter og journalister dele deres viden





