AI bereikt een nieuwe 'mijlpaal' en experts zijn doodsbang: "Dit lijkt me het begin van het einde!"

AI heeft officieel ontdekt hoe het zichzelf kan trainen zonder menselijke hulp — althans volgens de nieuwste aankondiging van AI-cloudbedrijf CoreWeave. Het bedrijf heeft een nieuwe reeks zogenoemde agentic AI-mogelijkheden gelanceerd voor zakelijke klanten.

Die lancering komt op een moment waarop de race om betrouwbaardere autonome AI-systemen te bouwen steeds sneller gaat. CoreWeave omschrijft het nieuwe platform als een manier om training, inference, monitoring en reinforcement learning samen te brengen in één gesloten feedbacklus.

Wat zijn AI-agents?

AI-agents worden door velen in de technologiesector gezien als de volgende grote stap na chatbots. In plaats van alleen vragen te beantwoorden, zijn ze ontworpen om taken uit te voeren, tools te gebruiken, beslissingen te nemen en problemen in meerdere stappen op te lossen met minder directe input van gebruikers.

Maar dat zorgt meteen ook voor een duidelijk probleem voor bedrijven die zulke systemen in echte werkomgevingen willen gebruiken. Een AI-assistent testen die één vraag beantwoordt, is al moeilijk genoeg. Een AI-agent testen die door een volledige workflow heen kan handelen, is nog veel ingewikkelder.

Waarom testen zo moeilijk is

Het probleem is dat traditionele ontwikkeling vaak afhankelijk is van lange offline tests voordat agents aan echte gebruikers worden blootgesteld. Maar zulke tests kunnen nooit elke situatie afdekken waarmee een AI-agent later geconfronteerd kan worden. Volgens CoreWeave is zijn nieuwe platform bedoeld om dat te veranderen door training en live gebruik met elkaar te verbinden. Daardoor kunnen AI-agents leren van activiteit in de echte wereld en zichzelf verbeteren terwijl ze actief zijn. Dat is de basis van de claim dat AI zichzelf kan “trainen”.

In plaats van training en live gebruik als twee aparte fases te behandelen, zegt CoreWeave dat zijn systeem reinforcement learning, productie-inference, monitoring van AI-agents en autonome verbetering samenbrengt. Het bedrijf noemt dit een stap richting de “superintelligence loop”, waarbij feedback uit echt gebruik veel sneller kan worden omgezet in verbeteringen dan bij traditionele testcycli mogelijk is.

Vier belangrijke onderdelen

Volgens de beschrijving bestaat de lancering uit vier grote onderdelen: CoreWeave Serverless RL, CoreWeave Inference, W&B Weave en W&B Skills met een MCP-server. Serverless RL moet bedrijven in staat stellen om grote taalmodellen na te trainen voor taken waarbij AI-agents meerdere stappen en interacties moeten uitvoeren, zonder dat ze zelf hun infrastructuur hoeven te beheren. CoreWeave stelde eerder dat Serverless RL bedoeld is om reinforcement learning op schaal eenvoudiger beschikbaar te maken voor ontwikkelaars.

CoreWeave Inference is bedoeld voor productiegebruik, terwijl W&B Weave fungeert als observatielaag. Daarmee kunnen teams het gedrag van AI-agents monitoren en fouten of zwakke plekken opsporen. W&B Skills en de MCP-server moeten programmeeragents vervolgens helpen om meer te functioneren als AI-onderzoekers en bouwers van andere agents. (lees verder onder de afbeelding)

“Het tempo van AI is de oude manier van bouwen voorbijgestreefd”

Chen Goldberg, Executive Vice President of Product and Engineering bij CoreWeave, zei: “Het tempo van AI heeft de manier waarop teams ervoor bouwen ingehaald. De afweging vandaag is: ontwikkelcycli die het niet kunnen bijhouden, of agents lanceren en pas in productie ontdekken waar ze falen.” Ze voegde eraan toe: “Bedrijven die agents eerst in productie brengen en ze continu laten verbeteren op basis van echte ervaring, bouwen niet alleen betrouwbaardere AI, ze versnellen ook de weg naar superintelligentie.”

Testen: te traag en te duur

Nick Patience, Vice President & Practice Lead AI Platforms bij Futurum, zei dat veel bedrijven vastzitten in een cyclus waarin ze agents bouwen en testen voordat die ooit echte gebruikers bereiken. Volgens hem wordt die aanpak te traag en te duur om vol te houden.

De grote belofte van CoreWeave is dus dat AI-systemen niet langer alleen vooraf worden getest, maar tijdens echt gebruik kunnen blijven leren en verbeteren. Toch blijft de formulering “AI traint zichzelf” vooral een sterke commerciële claim. In de praktijk gaat het om systemen die met menselijke doelen, infrastructuur, monitoring en veiligheidsregels worden opgezet, waarna ze via feedbackloops beter kunnen worden. Toch zijn niet alle tech-experts even enthousiast. Eén expert verwoordde het op sociale media als volgt: "Ik ben nu doodsbang. Dit lijkt me het begin van het einde!"

(Bron: LADBible - Afbeeldingen: Freepik)