Mythos vender tilbage: Anthropics tests viser, at Fable 5 ikke var særligt risikabel

  • Test viser, at Opus 4.8, GPT-5.5 og Kimi K2.7 kan identificere de samme sårbarheder.
  • Claude Fable 5 vender tilbage globalt, med øget beskyttelse, 2. juli.
  • Fable 5's nye klassificeringer markerer flere harmløse kodnings- og fejlfinding-opgaver.

Anthropic siger, at interne tests viste, at Claude Fable 5 ikke udgør nogen unik cybersikkerhedsrisiko, mens Claude Mythos 5 vender tilbage globalt den 2. juli.

Udmeldingen kommer i forbindelse med Fable 5’s globale relancering, som afslutter en 18 dages suspendering udløst af amerikanske eksportkontroller den 12. juni. Anthropic testede konkurrerende modeller for at vurdere den reelle trussel bag restriktionen.

Hvorfor Anthropic suspenderede Fable 5

Fable 5 og Mythos 5 blev lanceret den 9. juni, hvor de deler samme kernemodel, men Fable 5 var tilgængelig for offentligheden. Mythos 5 blev begrænset til en lille gruppe betroede Project Glasswing-partnere til defensivt cybersikkerhedsarbejde.

Eksportkontrollerne blev indført, efter at Amazon-forskere fandt en måde at omgå sikkerhedsforanstaltningerne i Fable 5. Metoden fik modellen til at identificere software-sårbarheder og i ét tilfælde demonstrere en udnyttelse.

Anthropics tests viste, at Claude Opus 4.8, GPT-5.5 og Kimi K2.7 kunne finde de samme sårbarheder, som Fable 5 blev nævnt for i Amazons rapport. Alle modeller kunne også gengive den viste udnyttelse.

Det tyder på, at påbuddet ramte en svaghed, der gælder bredt i branchen – ikke kun er et Fable-specifikt problem. Anthropic udviklede alligevel en stærkere klassifikator til at blokere metoden, som nu også markerer mere almindelige kode- og fejlsøgningsanmodninger.

Sådan virker sikkerhedsforanstaltningerne

Fable 5 blev lanceret med den stærkeste sikkerhedsmargin, Anthropics nogensinde har brugt i en model. Dens klassifikator blokerer anmodninger, der blot ser en smule risikable ud – ikke kun dem, der klart er skadelige. Den nye klassifikator, der blev trænet efter Amazon-rapporten, blokerer den omtalte omgåelse i over 99 % af tilfældene, oplyser Anthropic. Blokerede forespørgsler videresendes nu automatisk til Opus 4.8.

Den sikkerhedsmargin har dog en pris. Anthropic erkender, at klassifikatoren markerer flere harmløse kode- og fejlsøgningsanmodninger, og lover at blive ved med at forbedre den for at mindske antallet af falske positiver. Mythos 5, hvor der er færre af disse sikkerhedsforanstaltninger, blev kun genåbnet for Mythos 5-institutioner godkendt af myndighederne den 26. juni.

Anthropics egne data rejser et sværere spørgsmål: Hvis svagere modeller allerede kan det, som Fable 5 blev forbudt for, hvilken standard vil myndighederne så bruge næste gang, en avanceret model lanceres?


For at læse den seneste analyse af kryptovalutamarkedet fra BeInCrypto, klik her.

Ansvarsfraskrivelse

Alle oplysninger på vores hjemmeside offentliggøres i god tro og kun til generelle informationsformål. Enhver handling, der foretages af læserne på grundlag af oplysningerne på vores hjemmeside, er udelukkende på egen risiko.