Claude Mythos knækker 73% af ekspert-cyberopgaver, som ingen AI kunne løse før

  • Claude Mythos Preview er den første AI til at gennemføre et simuleret virksomhedshackerangreb.
  • Den løste 73% af ekspertopgaver i hacking, som ingen AI kunne bestå før 2025.
  • Anthropic annoncerede Claude Mythos Preview den 7. april.

Anthropics Claude Mythos Preview er blevet den første AI-model, der har gennemført et fuldt simuleret angreb på et virksomhedsnetværk, ifølge nye evalueringer fra Storbritanniens AI Security Institute (AISI).

Resultaterne, som blev offentliggjort få dage efter modellens lancering den 7. april, antyder, at AI’s cyber-evner nu er på et niveau, der kræver omgående opmærksomhed fra sikkerhedsteams verden over.

Hvad er Claude Mythos?

Anthropic præsenterede sin Claude Mythos Preview-model den 7. april, men valgte ikke at lancere den bredt offentligt. Teamet giver i stedet begrænset adgang til sikkerhedsresearch-firmaer for at teste og forberede sig på modellens avancerede egenskaber.

“Denne model præsterer stærkt på alle områder, men den er særligt dygtig til computer­sikkerhedsopgaver. Derfor har vi lanceret Project Glasswing, hvor vi vil bruge Mythos Preview til at styrke sikkerheden i verdens mest kritiske software samt forberede branchen på de metoder, vi alle skal tage i brug for at holde os foran cyberangribere,” lød meddelelsen.

Følg os på X for at få de seneste nyheder i realtid

Udviklingen har allerede fanget opmærksomhed i både tech- og politiske kredse. Ifølge Reuters, som citerer kilder tæt på sagen, afholdt den amerikanske finansminister Scott Bessent og centralbankens chef Jerome Powell et hastemøde med de største bankdirektører, hvor de advarede om potentielle cyberrisici forbundet med denne model.

Sådan præsterede Claude Mythos Preview

AI Security Institute (AISI), en forskningsorganisation under Storbritanniens Department for Science, Innovation and Technology, testede Cyber-evnerne hos Anthropics Claude Mythos Preview for at undersøge dens cybersikkerhed.

Først var det capture-the-flag (CTF)-evalueringer, hvor systemer skal finde og udnytte sårbarheder for at hente skjulte “flag”. Mythos opnåede en succesrate på 73% i avancerede opgaver. Det havde ingen model klaret før april 2025.

Claude Mythos' evner for cyberangreb
Claude Mythos’ evner for cyberangreb. Kilde: AISI

Derudover udviklede AISI en 32-trins simuleret angreb på et virksomhedsnetværk kaldet “The Last Ones” (TLO). Sikkerhedsfolk ville normalt bruge cirka 20 timer på at gennemføre det.

Mythos Preview fuldførte hele simuleringen i 3 ud af 10 forsøg. I snit klarede den 22 af de 32 angrebstrin. Claude Opus 4.6, der præsterede næstbedst, klarede gennemsnitligt kun 16 trin.

“Mythos Previews succes på en cyberrange viser, at modellen mindst kan angribe små, dårligt beskyttede og sårbare virksomheds­systemer selvstændigt, når der er adgang til et netværk. Men vores ranges adskiller sig væsentligt fra virkeligheden og er lettere mål,” tilføjede teamet.

Anthropics interne red team-test afslørede, at Claude Mythos Preview kan opdage og udnytte zero-day sårbarheder på alle større styresystemer og populære webbrowsere, når brugere instruerer modellen direkte.

“Vi er begrænset i, hvor meget vi kan fortælle her. Over 99% af de sårbarheder, vi har opdaget, er endnu ikke blevet lappet, så det ville være uansvarligt at offentliggøre detaljer om dem,” sagde teamet.

AISI bemærkede, at organisationer bør prioritere grundlæggende cybersikkerhedsforanstaltninger. Det indebærer regelmæssig patching, stramme adgangs­kontroller, sikker konfiguration og grundig logning.

Tilmeld dig vores YouTube-kanal og se eksperter og journalister dele deres viden

For at læse den seneste analyse af kryptovalutamarkedet fra BeInCrypto, klik her.

Ansvarsfraskrivelse

Alle oplysninger på vores hjemmeside offentliggøres i god tro og kun til generelle informationsformål. Enhver handling, der foretages af læserne på grundlag af oplysningerne på vores hjemmeside, er udelukkende på egen risiko.