De AI-race gaat hard: Opus 4.6 én GPT-5.3-Codex!

Welkom bij de eerste editie van de AI Agent nieuwsbrief, bedankt voor het aanmelden. We slaan direct af met groots nieuws. Maar eerst..:

Elke week deel ik de AI-ontwikkelingen die ertoe doen. Wat er speelt, wat het betekent, en wat je ermee kunt. Zodat jij er écht waarde uit kunt halen, voor je business en dagelijks leven. Let's dive in:

Gisteravond kreeg ik een push melding: "Opus 4.6 is uit". Enkele uren nadat het langverwachte model van Anthropic uitkwam, kwam rivaal OpenAI met GPT-5.3-Codex. De timing zegt genoeg. Dit is een race, en beide partijen willen winnen.

Claude Opus 4.6: de details

Boris Cherny, creator van Claude Code, over Opus 4.6. Source: X

Even de nerdy shit. Voor wie het wil weten.

1 miljoen tokens context: Dat betekent dat je een compleet boek, een hele codebase, of maanden aan emails in één gesprek kunt laden. Voorheen moest je het in stukjes knippen. Of kostte het simpelweg meer tijd voor de subagents de codebase te begrijpen. Nu gaat dat een stuk sneller. Later meer over wat we hier mee kunnen!

Agent teams ('swarms'): Dit is écht heel vet. Ik ben er al enkele uren mee aan het experimenteren vanochtend. Meerdere AI-agents die samenwerken aan één taak. De een doet research, de ander schrijft de code, een derde reviewed de geschreven code. In business taal: Jij (de CEO) die een idee heeft.. En die het bespreek je CTO (je Claude Code terminal), die vervolgens op basis van jouw feature requests, jouw geboden trainingen (skills, plugins, verbonden MCP’s) letterlijk software developers, marketeers, specialists ‘spawnt’ om te werken aan jouw idee. Dit verandert hoe je werkt. Hieronder een .html simulatie van wat er gebeurt als je agent teams aanzet (klik op de link hierboven om te zien hoe je deze setting aanzet).

Adaptive thinking: Het model bepaalt nu zélf hoeveel het moet nadenken. Bij een simpele vraag krijg je snel antwoord. Complex probleem? Dan gaat het model dieper graven, zonder dat je er specifiek om hoeft te vragen.

GPT-5.3-Codex: de details

OpenAI's antwoord op Opus 4.6. Ook even de specs.

Beste coding performance ooit (source: OpenAI): 57% op SWE-Bench Pro, 76% op TerminalBench 2.0, 64% op OSWorld. Voor de niet-nerds: dit zijn de standaard tests waarmee coding AI wordt gemeten. Deze scores zijn records.

25% sneller: En het gebruikt de helft van de tokens van de vorige versie voor dezelfde taken. Sneller én efficiënter dus.

Live bijsturen: Je kunt het model corrigeren terwijl het werkt. Zie je dat het de verkeerde kant opgaat? Gewoon ingrijpen en bijsturen. Dat kon voorheen niet. Dit noemen ze "mid-task steerability". Dit is een grote feature.

Computer use. Het model kan nu ook je computer bedienen. Klikken, typen, navigeren. Nog experimenteel, maar het werkt.

Het model dat zichzelf bouwde:

❝

"GPT‑5.3-Codex is our first model that was instrumental in creating itself. The Codex team used early versions to debug its own training, manage its own deployment, and diagnose test results and evaluations—our team was blown away by how much Codex was able to accelerate its own development.”

OpenAI - https://openai.com/index/gpt-5-3-codex

GPT-5.3-Codex is het eerste model dat heeft meegeholpen zichzelf te trainen en deployen. OpenAI's team gebruikte vroege versies om bugs te fixen, training te monitoren, en tests te analyseren. AI die AI bouwt. Dat is waar we nu zijn.

Oké leuk, maar wat betekent dit voor ons?

Dit is waar het interessant wordt.

Al die technische termen, tokens, swarms, adaptive thinking, klinken als nerd-speak. Maar de impact is heel concreet. Laat me het vertalen per type gebruiker.

Developer? De slimste devs die ik volg kiezen niet één model, ze switchen per taak.

Opus 4.6 voor: het plannen van architectuur en complexe problemen.
GPT-5-3-Codex voor: snel uitvoeren en debuggen.

Niet óf-óf, maar én-én!

En die 1 miljoen tokens context van Opus 4.6? Voor coding is 200k vaak genoeg. Waar het wél presteert: als je een complete codebase in één keer wilt analyseren.

Werk je op kantoor? Hier wordt Opus 4.6 héél interessant. 90.2% score op juridisch redeneren. Context window van 1 miljoen tokens.

Maanden aan emails doorzoeken. Complete jaarverslagen analyseren. Klantfeedback van een heel kwartaal samenvatten. Dingen waar je normaal dagen voor uittrekt, doe je nu in minuten. Office automation is waar Opus echt uitblinkt. Zó veel toepassingen zijn er.. We gaan het allemaal meemaken dit jaar.

Ben je ondernemer? Dit is waar agent teams uitblinken. Opus 4.6 kan meerdere sub-agents coördineren zonder de draad kwijt te raken. Multi-day workflows die context niet vergeten. Denk aan: Een research agent die tonnen documenten leest en alles onthoudt. Een assistent agent die je hele projectgeschiedenis kent. Een coördinator agent die je team van AI-agents aanstuurt.

Eén agent doet je marktonderzoek, een ander schrijft je content een derde checkt alles. Zonder dat jij hoeft te coördineren. Nee, dit is geen toekomstpraat, dit werkt nu.

De vraag is niet óf je het gaat gebruiken, maar wanneer je concurrenten het gaan doen.

De bottom line?

De waarde die jij uit AI kunt halen groeit met de dag. We zitten in de hoogste versnelling van de adoptie van AI Agents.

Praktische tips om er meer uit te halen

Laat Claude nadenken. Bij complexe vragen loont het om te vragen: "Denk hier goed over na voordat je antwoordt." Dit werkt serieus heel erg goed.

Gebruik de 1m context size van Opus 4.6. Vraag je Agent of hij hele documenten voor je wilt analyseren op verbanden. Een jaarverslag te analyseren. Maanden aan klantfeedback samen te vatten. Dingen die voorheen in stukjes moesten, kunnen nu in één keer.

“use subagents” / splits grote taken op. Bij complexe projecten kun je Claude vragen om sub-taken parallel uit te voeren. Wees niet bang om Claude harder aan het werk te zetten. Voeg simpelweg “use subagents” toe aan je prompt voor meer compute (tip van Boris!).

/Playground van Claude Code: Playground Builder maakt interactieve HTML-tools waar je visueel instellingen aanpast met een live preview. Voor degene die hebben opgelet: de simulatie van Team agents is óók gemaakt met /playground! Als je tevreden bent, genereert het een prompt die je direct terug in Claude kunt plakken. Heel erg handig voor als je een probleem wilt visualiseren!

Run /insights in je Claude Code terminal: vervolgens zal Claude je bericht geschiedenis met Claude analyseren en samenvatten en je suggesties doen van hoe je je workflow verder kunt verbeteren. Ik heb het al gedaan en bij mij kwam er o.a. uit dat ik 3,2 miljoen lines of code heb geschreven in de afgelopen maand. Ter vergelijking: voor mij was dit getal 200k in heel 2025!

Claude Code Github commits nemen exponentieel toe

Source: Dylan Patel (SemiAnalysis) on X

Momenteel wordt 4% van alle GitHub commits geschreven door Claude Code. Dat zijn er 134.000+ per dag. De verwachting is dat dit 20%+ is tegen eind 2026.

Niet gek, als zelfs de creator van Claude Code toegeeft geen enkele regel code meer zelf te schrijven:

❝

“Pretty much 100% of our code is written by Claude Code + Opus 4.5. For me personally it has been 100% for two+ months now, I don’t even make small edits by hand. I shipped 22 PRs yesterday and 27 the day before, each one 100% written by Claude”

Wat betekent dit voor jou?

Dit betekent dat iedereen nu code kan ~~schrijven~~ laten schrijven. De kunst van het coderen zal hoogst waarschijnlijk uitsterven omdat de agents het van ons overnemen. Gewoon, omdat een agent het vele malen efficienter kan dan een mens.

Als je ooit een idee hebt gehad voor een tool maar dacht "ik kan niet programmeren", die drempel is nu weg. Het kost je hooguit een avond om te ontdekken wat mogelijk is. Vervolgens zal je er wel diep in moeten duiken, want zo simpel als een paar keer prompten en verwachten dat je product werkt, is het niet. Maar veruit voor de meeste mensen zit de grootste waarde in het ‘unlocken’ van het gebruik maken van een agent.

Gebruik je AI Agent als dagelijks werkpartner.

De meeste mensen openen hun AI Agent, stellen één vraag en sluiten het weer af. Dat is alsof je een auto koopt en alleen de radio gebruikt. Niet eens. Alsof je een Ferrari huurt en er een keer in zit om te ervaren hoe het voelt. Onzin natuurlijk.

De echte waarde zit in het optimaal gebruik maken de AI Agent.

Nee, ik heb het nu niet over de simpele chatbot. Ik heb het namelijk over OpenClaw. OpenClaw is een open-source AI-agent die op je eigen computer of server draait en taken uitvoert via o.a. WhatsApp of Telegram. E-mails versturen, je agenda beheren, code schrijven, gewoon door een berichtje te sturen. Het project ging viraal met 145k+ GitHub-stars in een paar dagen. Simpel is het niet. De agent krijgt toegang tot al je accounts, dus je moet precies weten wat je doet qua beveiliging. Maar het geeft wel een goed beeld van waar persoonlijke AI-assistenten naartoe gaan.

Persoonlijk gebruik ik OpenClaw (voorheen: Clawdbot en Moltbot) al een maand, en het is echt een gamechanger. De reden waarom ik er zó veel uit haal is omdat ik het volledig heb customized met unieke skills die ik heb gecreerd (een document waarin ik zijn taken uitleg) en software die ik heb geschreven waar hij gebruik van maakt om een nóg betere assistent te zijn van mij. OpenClaw is simpelweg een auto. Je moet ‘m vervolgens wel customizen.

OpenClaw verzorgt momenteel voor mij:

Morning standups: Elke ochtend krijg ik een briefing. Welke ontwikkelingen in de wereld (overnight) moet ik weten, gebaseerd op mijn huidige projecten en interesses? Uiteraard scrapet hij Linkedin/Twitter (X) zodat ik minder tijd kwijt ben aan social media. Wat staat er vandaag op de planning? Strakke deadlines waar ik mij aan moet houden. Etc.
Project Management: Hij doet voor al mijn projecten een lange termijn planning, gebaseerd op mijn gestelde doelen. Reviewed code die ik heb geschreven met Claude Code. Doet een voorstel als hij denkt dat iets anders moet. Past de sprint planning aan als dingen uitlopen.
Kritische Co-CEO: Dit is misschien wel het belangrijkste. Hij is erg kritisch en helpt me reflecteren op waar ik mijn tijd aan spendeer. Doet marktonderzoek, terwijl ik slaap, naar mijn huidige projecten. Laat het mij weten wanneer hij denkt dat er iets interessants te delen is. Zorgt er voor dat ik niet vergeet dat ene belletje te plegen.
Day-end standup: Aan het einde van de dag stuurt hij me een berichtje nadat hij al mijn projecten heeft gescand op GitHub. Update de sprint planning. Vraagt me wat goed ging en wat niet. Slaat dit op en onthoudt dit voor de volgende dag.
Administratie: Binnenkort verzorgt OpenClaw ook mijn administratie, omdat ik ook daar software voor heb gebouwd. Zo verminder ik mijn saaie taken en kan ik mij maximaal focussen op hetgeen wat ik het leukst vind om te doen.
Security: Uiteraard gebeurt alles op een veilige manier, achter slot en grendel. Mijn AI Agent draait in een veilige omgeving die alleen door mij toegankelijk is.

Het voelt in het begin onwennig. Alsof je vals speelt. Na een week vraag je je af hoe je ooit zonder werkte.

Mijn tip voor de lezer: kies één terugkerende taak die je deze week hebt. Eentje maar. Probeer die met AI te versnellen. Je zult verbaasd zijn.

Solopreneurs zijn niet langer een grap. Dit is de realiteit.

Alle taken die herhaaldelijk plaatsvinden en die je kunt beschrijven, kunnen grotendeels worden geautomatiseerd. De functie "assistent" is overbodig aan het worden. Mijn vrienden kijken me raar aan wanneer ik dat zeg, maar het is echt zo.

De race gaat niet meer over wie de slimste chatbot bouwt. Het gaat over wie de beste werkpartner bouwt.

En die wedstrijd is al begonnen.

Ik werk aan een manier om dit soort AI-werkpartners toegankelijk te maken voor iedereen, zonder technische kennis. Meer daarover als het zover is.

Tot volgende week. Fijn weekend.

Tarik

Vragen, opmerkingen of suggesties? Laat het weten.