Kina har netop bygget en stor kunstig intelligens-model uden Nvidia-chips. Nu har OpenAI fundet metoder til at køre med langt færre af dem og skære inferensomkostningerne med over halvdelen. Alligevel steg Nvidia-aktien.
Det er gåden. OpenAI er en af Nvidias (NVDA) største kunder. Alligevel steg aktien, selvom de nu har brug for færre chips.
OpenAI skærer inferensomkostninger på to fronter
Den første front er software. Tidsskriftet The Information rapporterede, at OpenAI-ingeniører har mere end halveret inferensomkostninger med nye optimeringsmetoder. OpenAI har ikke offentliggjort de tekniske detaljer.
Besparelserne reducerer antallet af Nvidia-chips, som kræves til at håndtere noget af ChatGPT-trafikken. Det kan også give OpenAI mulighed for at sænke priser eller hæve forbrugsgrænser.
Den anden front er hardware. Den 24. juni præsenterede OpenAI og Broadcom (AVGO) Jalapeño, deres første specialdesignede chip. OpenAI udtalte, at tidlige tests viser langt bedre ydeevne pr. watt end de bedste chips i dag, og designet tog ni måneder.
De første chips vil blive sat i drift i gigawatt-skala inden udgangen af 2026, med Microsoft som hovedpartner. Nvidia driver stadig størstedelen af OpenAI’s inferens, også selvom OpenAI finansierer sit chipsamarbejde med Broadcom.
Større tech-virksomheder konkurrerer om at bygge egne chips
OpenAI er ikke alene. Google har produceret tensor-processorenheder siden 2016, og Amazon fulgte trop med egne løsninger. Research-firmaet TrendForce forudser, at ASIC-baserede systemer når op på 27,8% af AI-serverudsendelserne i 2026 – det største siden 2023.
Ifølge TrendForce er det første gang, at specialchips ventes at vokse hurtigere end Nvidias GPU’er. Leverandører som Broadcom og Marvell er blevet centrale producenter af specialchips i denne udvikling.
Sanctions driver en lignende udvikling i Kina. Meituan har for nylig trænet sin LongCat-2.0-model med 1,6 billioner parametre på kinesiske chips – uden Nvidia-hardware.
Hvorfor Nvidia-aktien bliver ved med at stige
Truslen er reel, men tallene forklarer roen. Nvidia-aktien steg næsten 2% den 30. juni og nærmer sig en værdi på 4,8 billioner dollars. Nvidias seneste regnskabstal viste, at datacenteromsætningen steg med 75% til rekordhøje 62,3 milliarder dollars på blot ét kvartal.
Mest af presset ligger på inferens – ikke træning. Nvidia dominerer stadig model-træning, hvor dens CUDA-software har fastholdt udviklere siden 2006. Speciallavede chips kan sjældent matche den fleksibilitet.
Nvidia forsvarer også inferenslaget, som virksomheden beskyldes for at miste. På GTC sagde Nvidia, at den kommende Rubin-platform reducerer inferensomkostninger pr. token med op til 10 gange sammenlignet med Blackwell. Billigere inferens løfter normalt både forbruget og den samlede datakraft.
Det er ikke alle, der er overbeviste. Nogle investorer har flyttet kapital til konkurrerende chipaktier og satser på, at inferensskiftet får større betydning. Men Nvidia guider til dette kvartal uden nogen Kina-salg og oplever stadig rekordefterspørgsel.
Nvidia sælger stadig samtlige chips, den kan fremstille. Den virkelige test er, om de største kunder kan undvære Nvidia hurtigere, end markedet vokser.









