Anthropic og OpenAI åbnede et nyt kapitel i deres rivalisering på tirsdag, begge målrettet videnskabelig research. Anthropic lancerede Claude Science, et AI-værktøj for forskere, mens OpenAI udgav GeneBench-Pro, en måling for beregningsbaseret biologi.
Udgivelserne samme dag skubber AI-kapløbet ud over chatbots og kodning og ind i laboratoriearbejdet. Én virksomhed leverede et redskab, som forskere kan bruge i dag. Den anden skabte en målestok for, hvor langt teknologien stadig mangler at komme.
Hvad laver Claude Science fra Anthropic
Claude Science samler de databaser, kode og computerkraft, som forskere benytter, i én app. Den forbinder over 60 videnskabelige databaser indenfor genetik, proteomik og kemi-informatik.
Claude Science er en app, ikke en ny model. Den lanceres samtidig med, at Anthropics mest avancerede Fable 5- og Mythos 5-modeller stadig er begrænset af amerikanske eksportregler. Alle resultater kan spores og følges helt tilbage til koden, der producerede dem.
Værktøjet udvider det fokus på livsvidenskab, Anthropic indledte i oktober 2025. I betaen brugte Allen Institutes Jérôme Lecoq det til at sammenfatte evalueringer, der tidligere kunne tage op til to år.
Anthropic vil også støtte op til 50 forskningsprojekter med op til $30.000 i credits hver.
OpenAI’s GeneBench-Pro hæver niveauet
Kort efter udgivelsen af Claude Science fra Anthropic, offentliggjorde OpenAI GeneBench-Pro. Det tester, om AI-agenter kan træffe de afgørelser, som virkelig biologisk forskning kræver.
Målingen indeholder 129 opgaver på tværs af genetik, kvantitativ biologi og translationel medicin.
OpenAIs stærkeste model, GPT-5.6 Sol, løste 28,7% af opgaverne på sin højeste ræsonnement-niveau. Tallet steg til 31,5% i Pro-tilstand. Firmaets tidligere fasede GPT-5.6-udgivelse skete på Washingtons anmodning.
GPT-5 fik under 5% på den oprindelige GeneBench, mens Anthropics Opus 4.8 nåede 16% på den sværere test.
Følg os på X for at få de sidste nyheder, mens de sker
To strategier, ét kapløb
Opdelingen viser to veje til samme mål: Anthropic leverer et produkt til dagligt brug i laboratoriet. OpenAI måler hvor pålidelig modellerne ræsonnerer sig igennem ustrukturerede data.
Begge lanceringer kommer samtidig med, at kinesiske modeller vinder frem indenfor AI-forskning. OpenAIs egne tal dæmper begejstringen, fordi deres bedste model stadig fejler på størstedelen af GeneBench-Pro-opgaverne.
Presset er både geopolitiske og videnskabelige. Amerikanske eksportbegrænsninger får allerede Anthropic til at overveje nye værtslande til deres modeller.
Vurderingerne lyder, at hver GeneBench-Pro-opgave for en menneskelig ekspert vil tage 20-40 timer og koste tusindvis af dollars. OpenAI sagde, at deres model løser den samme analyse for få dollars.
Aubrey de Grey, biomedicinsk gerontolog, ser AI løsne vigtige flaskehalse i research – selv hvis bredere fremskridt tager længere tid.
“Hvad vi snart kommer til at se, er, at AI vil gøre visse dele af processen – især udvikling af medicin – ikke længere vil være den begrænsende faktor,” sagde Aubrey de Grey, præsident og Chief Science Officer for Longevity Escape Velocity Foundation, i en BeInCrypto-podcast.
De Grey advarede, at det fortsat afhænger af regulering og offentlighedens risikotolerance, om hurtigere forskning fører til godkendte behandlinger.
Forskere forventer hurtigere udbredelse
Nogle specialister mener, at skiftet allerede er i gang. Dr. Derya Unutmaz, professor i immunologi, fortalte på samme BeInCrypto-panel, at AI nu overgår hans egen dømmekraft.
“Personligt stoler jeg mere på AI end på mine egne idéer inden for mit felt, som jeg har arbejdet med i 35 år.”
Han forventer, at denne afhængighed hurtigt vil brede sig i klinisk praksis.
“Det er uetisk, og jeg tror meget snart, det vil være malpractice ikke at bruge AI i medicin.”
Optimismen løber dog forud for målingerne. De kommende måneder vil vise, om forskere tager disse værktøjer til sig – og om GeneBench-Pro-scorerne begynder at stige.









