189 Wanneer AI een lichaam krijgt
Wanneer AI een lichaam krijgt
Over zintuigen, handelen en de onverwachte snelheid van leren.
In de jaren tachtig had je de Comdex (Computer Dealers Exposition) in Las Vegas. Ik was er bijna jaarlijks te vinden om de nieuwste technologie op te snuiven en mijn beeld over onze toekomst bij te stellen. Tegenwoordig heet het de CES (Consumer Electronics Show). Voor mij is zo’n expositie nog steeds een manier om kennis te maken met onze toekomst en mijn fantasie te prikkelen over wat de ontwikkelingen zijn, alleen doe ik dat nu allemaal van achter de computer thuis, aangevuld door de wetenschappelijke filmpjes op Youtube…
Als je niets met al die technologie hebt dan snap ik dat natuurlijk, maar je kunt niet ontkennen dat het ingrijpend ons leven beïnvloedt en dus is misschien de ‘kop in het zand’ ook niet de optimale keuze. De meesten hadden echt geen email nodig, geen iPad of smartphone of… en misschien herken je je daar zelfs in, maar ik denk toch dat er weinigen zijn die dat nu nog steeds huldigen. De Early Adopters versus de Laggards zullen we maar zeggen. De wereld verandert en als je daar deel van uitmaakt vraagt dat ook iets van jou en niet alleen van al die anderen. Voor mijzelf is zo’n show de trigger om na te denken over wat dit alles kan/zal betekenen voor onze toekomst. Hoe gaat onze wereld veranderen en waarom en waar gaat het uiteindelijk naar toe? Dat is zeker niet allemaal positief maar daarmee dus des te meer het overdenken waard.
Intelligente robots, het komt nu allemaal wel echt dichtbij. Het gesprek over AI ging de afgelopen jaren soms al over bewustzijn en moraliteit, maar wordt het ook echt zelfbewust? Voelt het iets? Heeft het straks rechten? De vragen zijn niet onzinnig — Nobelprijswinnaar Geoffrey Hinton (Godfather of AI) waarschuwt er met klem voor. Ze leiden echter de aandacht af van een verschuiving die nu wel al in volle gang is — een verschuiving die geen bewustzijn nodig heeft om diep ingrijpend te zijn en die vaak wordt aangeduid als ‘belichaming’ (embodied AI). Een AI-systeem dat alleen leeft in een tekstvenster, kan nog zo slim zijn — het beïnvloedt de wereld pas wanneer een mens iets met de output doet. Geef het systeem zintuigen (zelfs veel meer en beter dan de mens) — camera’s, microfoons, sensoren — en geef het ledematen — wielen, grijpers, motoren — en de aard van de relatie tussen mens en machine kantelt. Het systeem wordt dan geen adviseur meer. Het wordt een actor, een entiteit die zelf leert en interpreteert met gevolgen zónder menselijke tussenkomst.
Een gesloten lus
In een AI-model zonder lichaam hangt elke handeling aan een mens. Iemand stelt een vraag, het model produceert een antwoord, iemand beoordeelt of die nuttig is, iemand voert eventueel iets uit. Tussen prompt en effect zit altijd een menselijke schakel. De keten kan worden onderbroken op elk moment, en dat gebeurt ook regelmatig — onbewust, omdat we zelden alle output van AI klakkeloos overnemen.
In een AI-systeem met sensoren en actuatoren ontstaat iets anders. Een gesloten lus: waarnemen, beslissen, handelen, opnieuw waarnemen. Dit principe ligt ook ten grondslag aan reinforcement learning, een van de dominante leerparadigma’s binnen moderne AI (Sutton & Barto). De mens hoeft daar niet meer in voor te komen. Een autonome bezorgrobot rijdt door een woonwijk, interpreteert het verkeer, kiest een route, vermijdt een hond, parkeert bij een deur. Een geautomatiseerde productiehal verschuift onderdelen tussen werkstations zonder dat iemand het exacte moment heeft aangewezen waarop dat moest gebeuren. Een agrarische sproei-robot inspecteert bladeren, herkent een schimmel, kiest een dosering, voegt ze toe.
Wat hier verschijnt is geen menselijk wezen, ook geen bewust wezen, maar wel iets nieuws: een operationeel zelfstandige actor. Het systeem hoeft geen ervaring te hebben om in de wereld in te grijpen. Het hoeft niets te willen om continu door te draaien.
Gedrag dat lijkt op willen
Wie zo’n systeem langdurig laat opereren, ziet gedragingen ontstaan die opvallend menselijk lijken. De robot zoekt zelf het laadstation op wanneer de batterij richting twintig procent zakt. Hij vermijdt routes waarop hij eerder schade heeft opgelopen. Hij plant onderhoudsmomenten in tijdens rustige uren. Hij waarschuwt zijn operator wanneer een sensor afwijkende waarden geeft.
In de literatuur worden dit instrumentele doelen genoemd (Omohundro, Bostrom): geen oorspronkelijke wensen, maar afgeleide subdoelen die elk doelgericht systeem ontwikkelt zodra het zijn hoofddoel langdurig moet dienen. Een ‘agent’ die boodschappen moet ophalen heeft brandstof nodig om te rijden, en gaat dus tanken plannen. Niet uit honger, niet uit zorg, niet uit angst — maar uit logica.
Het verschil tussen willen en optimaliseren is filosofisch zuiver houdbaar. Voor een mens is een tekort iets dat hij ondervindt. Een systeem registreert het en past zich erop aan. Toch verdient dit onderscheid een kanttekening. Voor de wereld waarin de actor opereert, telt het gedrag, niet de innerlijke staat. Een robot die zich systematisch terugtrekt om beschadiging te vermijden gedraagt zich, voor alle praktische doeleinden, alsof hij iets te verliezen heeft. Of dat innerlijk klopt, is voor de buurman die hem op straat tegenkomt geen relevante vraag.
De stille versnelling: leren
De meest onderschatte verandering zit echter niet alleen in wát deze systemen doen, maar ook in hoe snel ze béter worden in wat ze doen.
Een mens leert sequentieel. Hij maakt fouten, denkt erover na, probeert het opnieuw, verbetert geleidelijk. Kennis verspreidt zich tussen mensen via taal, opleiding, voorbeeld — een traag, ambachtelijk proces dat generaties kan vergen. Een chirurg met dertig jaar ervaring is een uitzonderlijk fenomeen, juist omdat ervaring tijd vergt en niet overdraagbaar is in een download.
Een AI-systeem met robotica leert anders. Het leert continu — geen werkdagen, geen vakantie, geen vermoeidheid. Het leert parallel — naar schatting ervaren duizend voertuigen in evenveel steden in dezelfde week samen meer verkeerssituaties dan een individuele bestuurder in een mensenleven, zoals zichtbaar is in praktijken rond autonome voertuigen (o.a. Waymo, Tesla). Het leert uit simulatie — voordat een fysieke robot één meter aflegt, heeft een digitale variant al miljoenen scenario’s doorlopen, zoals onder meer is aangetoond in werk van OpenAI en DeepMind op het gebied van robot learning. En vooral: het kan wat het leert delen. Wat één systeem ontdekt, kan — in architecturen die dit ondersteunen — snel beschikbaar komen voor andere systemen, bijvoorbeeld via vormen van gedeelde of federated learning.
Dat is dus geen versnelling van een bestaand proces, maar een proces met andere kenmerken.
Wat dit doet met correctie
Een adviserend systeem kan worden gecorrigeerd voordat er iets onomkeerbaars gebeurt. Iemand ziet een fout in een rapport, een misdiagnose in een voorstel, een vooroordeel in een ontwerp — en grijpt in voor de uitvoering volgt.
Een handelend systeem werkt anders. Het creëert feiten. De pakketten zijn afgeleverd, de spuit is gegeven, de lasnaad is gelegd. Wat fout is gegaan, valt nog te repareren — meestal — maar de correctie verschuift naar achteraf. Daarmee komen twee zaken op de voorgrond te staan: de kwaliteit van de doelstelling en de toetsbaarheid van het handelen. Dit sluit aan bij bredere analyses, onder meer van de OECD en andere beleidsorganisaties, die wijzen op de groeiende uitdaging om complexe AI-systemen controleerbaar en uitlegbaar te houden.
Macht verschuift naar de probleemdefinitie
Naarmate systemen meer zelfstandig opereren, verschuift een onopvallend maar fundamenteel iets: de plek waar de werkelijke beslissing valt. Niet meer in de uitvoering — die loopt via de machine — maar in de definitie van wat het probleem is dat moet worden opgelost en welke randvoorwaarden daarbij moeten gelden.
Een logistiek systeem dat bijvoorbeeld geoptimaliseerd is op leveringssnelheid gaat zich anders gedragen dan eenzelfde systeem geoptimaliseerd op brandstofverbruik, op werknemerwelzijn, of op klanttevredenheid. De technische uitvoering kan in alle vier de gevallen perfect zijn, maar de maatschappelijke uitkomsten verschillen ingrijpend.
Wat dit concreet vraagt van ons
De consequenties van deze verschuiving liggen dus niet alleen bij technologie, maar vooral bij de rollen eromheen.
Voor de gebruiker — de burger — begint het met een ogenschijnlijk eenvoudige vraag: wat wordt hier eigenlijk geoptimaliseerd? Snelheid, kosten, veiligheid, gemak? Een systeem dat “goed werkt” kan tegelijkertijd uitkomsten produceren die we onwenselijk vinden, simpelweg omdat het doel verkeerd gekozen is. Terughoudendheid in blind vertrouwen is daarmee dus geen wantrouwen, maar een vorm van verantwoordelijkheid geworden.
Voor organisaties en bestuurders verschuift de verantwoordelijkheid daarmee naar de voorkant. Niet alleen: werkt het systeem? Maar vooral: is expliciet gemaakt welk doel het dient, en is toetsbaar hoe het tot beslissingen komt? Zonder die helderheid wordt bijsturen achteraf al snel een vorm van schadebeperking.
Voor toezicht en governance verandert het moment van ingrijpen. Niet pas na incidenten, maar vooraf — in het expliciet maken van doelstellingen, randvoorwaarden en grenzen. En misschien nog fundamenteler: de snelheid waarmee systemen worden ingevoerd moet in verhouding blijven tot de capaciteit om ze te begrijpen en te toetsen. Waar implementatie sneller gaat dan toezicht kan bijhouden, ontstaat geen innovatievoorsprong maar bestuurlijk tekort.
Want waar handelen versnelt, moet begrip niet achterblijven.
Het misverstand dat ons afleidt
De vraag of AI ooit bewust wordt, blijft fascinerend, maar wat zich nu al voltrekt is wezenlijker: systemen die handelen, leren, zich aanpassen en op grote schaal opereren — zonder dat ze iets ervaren.
De combinatie van handelen, schaal en leersnelheid creëert een asymmetrie die zich niet vanzelf oplost. Daarmee verschuift de kernvraag weg van ‘hoe slim deze systemen zijn’, in de richting ‘hoe we hun handelen toetsbaar, beheersbaar en legitiem houden’. De uitdaging ligt dus niet primair meer in het bouwen van intelligentie. Die kant ontwikkelt zich al snel genoeg en door de zintuiglijke combinatie exponentieel. Ze gaat ons ver voorbij (AGI-ASI). De uitdaging ligt in het begrenzen ervan…
Of scherper geformuleerd: het probleem is niet dat machines te weinig begrijpen. Het probleem is dat ze te snel handelen op basis van wat wij onvoldoende hebben doordacht.
En daarmee komt alles terug op één punt. Niet wat systemen kunnen leren, maar hoe expliciet wij kunnen blijven bepalen wat zij mogen doen — en hoe snel we dat kunnen blijven herijken.
Jeroen Teelen
29 april 2026
Voor wie zich verder wil verdiepen in de achterliggende ontwikkelingen en inzichten:
(bronnen, wel en niet empirisch, en verdere verdieping)
- Sutton, R.S. & Barto, A.G. (2018). Reinforcement Learning: An Introduction (2e editie). MIT Press.
→ Standaardwerk over hoe systemen leren via waarnemen–handelen–feedback. - OpenAI (2018). Learning Dexterity.
https://openai.com/research/learning-dexterity
→ Laat zien hoe robots complexe handelingen leren via grootschalige simulatie. - Brohan, A. et al. (Google DeepMind, 2023). RT-2: Vision-Language-Action Models Transfer Web Knowledge to Robotic Control.
https://arxiv.org/abs/2307.15818
→ Voorbeeld van hoe AI-systemen visuele input, taal en fysieke acties combineren. - Waymo (diverse publicaties). On the Road to Fully Self-Driving.
https://waymo.com/research/
→ Praktijkvoorbeelden van grootschalig leren in autonome voertuigen. - Tesla AI Day (2021–2024 presentaties).
https://www.tesla.com/AI
→ Illustraties van ‘fleet learning’: leren uit collectieve rijervaring. - Omohundro, S. (2008). The Basic AI Drives.
→ Introductie van het concept ‘instrumentele doelen’ in AI-systemen. - Bostrom, N. (2014). Superintelligence: Paths, Dangers, Strategies. Oxford University Press.
→ Bespreekt hoe doelgerichte systemen subdoelen ontwikkelen. - OECD (2023). OECD Framework for the Classification of AI Systems.
https://www.oecd.org/ai/
→ Over de uitdagingen rond governance, controle en classificatie van AI. - World Economic Forum (2023). The Global Risks Report.
→ Behandelt o.a. de kloof tussen technologische ontwikkeling en regulering.

Plaats een Reactie
Meepraten?Draag gerust bij!