Het belang van actief leren in het tijdperk van grote taalmodellen

Het belang van actief leren in het tijdperk van grote taalmodellen. Di Paolo et al (2024) brengen in dit artikel de werking van ons voorspellende brein, grote taalmodellen (LLM’s) en Montessori onderwijs bij elkaar, om zo het belang van actief leren in het tijdperk van LLM’s te onderbouwen.
Voorspellend brein
Een kernbegrip in de theorie van het voorspellende brein is actieve inferentie. Dit is een theorie over hoe waarneming en actie samenhangen. In dit artikel schrijf ik meer over de vier componenten van ons voorspellende brein. Het brein bouwt een intern model, en met behulp van dit model worden acties gegenereerd die ons beschermen tegen schadelijke interacties met de omgeving en ons juist brengen naar situaties die gunstig zijn voor overleving. Om dat model te bouwen en die acties te genereren is efficiënt leren nodig.
Voorspellingsfouten en precisie
Als voorspellingen niet kloppen met wat we waarnemen, ontstaan er voorspellingsfouten. Die sturen zowel ons handelen als het aanpassen van onze verwachtingen. Niet elke fout weegt even zwaar: via ‘precision weighting’ bepaalt het brein welke fouten belangrijk genoeg zijn om van te leren. Sommige fouten zetten aan tot leren en actie, andere worden grotendeels genegeerd. Diezelfde precisie speelt ook een rol bij actie: het geeft aan hoeveel vertrouwen er is dat een bepaalde handeling onzekerheid kan verminderen. Voorspellingsfouten kunnen op twee manieren kleiner worden. Ofwel passen we ons interne model aan zodat het beter klopt met de werkelijkheid, ofwel ondernemen we actie om de werkelijkheid meer in lijn te brengen met onze verwachtingen.
Actieve inferentie verklaart actie
Actie en het kiezen van acties zijn dus sterk verbonden met ons lichaam en onze directe interactie met de omgeving. Bij actieve inferentie speelt actie een centrale rol. We handelen om voorspellingsfouten op de lange termijn te verkleinen. Dat kan door de wereld te veranderen zodat die beter past bij onze verwachtingen (doelgericht handelen), of door informatie op te zoeken die ons helpt beter te begrijpen wat er gebeurt (‘epistemische actie’).
Foutendynamiek
Hoewel onze breinwerking dus draait om het verminderen van onzekerheid, kunnen fouten juist ook nuttig zijn. Sommige vormen van onzekerheid geven aan dat er iets te leren valt. We zoeken daarom vaak situaties op die nét uitdagend genoeg zijn (‘learning sweet spot’) en blijven daarin oefenen tot we ze beheersen, waarna we de lat hoger leggen. Dit helpt te verklaren waarom we soms zelfs fouten opzoeken én oplossen. Het verklaart ook waarom nieuwigheid wellicht zowel een fysieke als een psychologische basisbehoefte is.
Ons gevoel
De gevoelens die daarbij horen geven als het ware aan hoe goed de leersituatie is: ze laten zien of we op het juiste niveau bezig zijn. Zie ook dit artikel: voorspellingsprecisie en emoties. Het voelt goed om fouten sneller op te lossen dan verwacht. We zijn gevoelig voor veranderingen in de snelheid waarmee fouten in de tijd worden verminderd ten opzichte van onze verwachting. Dus; lossen we fouten sneller (positief gevoel) of langzamer (frustratie) op dan we verwachtten en boeken we daarin progressie (positief gevoel). Hoe we ons voelen is een cruciaal onderdeel van actieselectie. We kiezen opnieuw voor de acties die effectief waren en proberen nieuwe strategieën uit wanneer bestaande acties niet de verwachte snelheid van foutreductie opleveren.
Montessori onderwijs
Deze foutendynamiek zet ons aan tot exploratie, nieuwsgierigheid en spelen. Het Montessori onderwijs komt grotendeels overeen met de verwante concepten binnen AIF: intrinsieke motivatie, aandacht, precisie en foutcontrole. De basis is de intrinsieke motivatie van kinderen: ze willen zelf handelen, ontdekken en kiezen. Zonder externe beloningen zoals cijfers leren ze door te doen en ontwikkelen ze begrip, zelfstandigheid en autonomie. Als die vrijheid wordt beperkt, belemmert dat hun ontwikkeling. Kinderen kiezen activiteiten die voor hen betekenisvol zijn en worden daar steeds beter in. Fouten spelen daarbij een belangrijke rol: door fouten te maken en te herstellen leren ze preciezer werken. Daarom zijn materialen en de leeromgeving zo ingericht dat kinderen hun eigen fouten kunnen zien en verbeteren. In een Montessori-klas gebeurt leren vooral door interactie met de omgeving. Het klaslokaal is een ‘voorbereide omgeving’: een zorgvuldig ingerichte ruimte met materialen die kinderen uitnodigen om te ontdekken en te leren, op hun eigen niveau en tempo, vaak in groepen met verschillende leeftijden.
Eerst ervaren, dan betekenis geven
Als je spel ziet als een manier om kennis te verkennen, wordt duidelijk waarom kinderen zo worden aangetrokken door nieuwe dingen, zo leggen de onderzoekers uit. Die dingen bieden kansen om iets te ontdekken en onzekerheid op te lossen. Daarom reageren jonge kinderen vaak ook minder negatief op fouten dan volwassenen. Montessoriklaslokalen zijn zo ingericht dat kinderen steeds net op het randje van hun kunnen werken en eerst ervaren, en daarna pas begrijpen. Fouten maken hoort daar bewust bij. De materialen zijn zo ontworpen dat fouten zichtbaar worden, zodat kinderen ze zelf kunnen opmerken en herstellen. Zo stimuleert de leeromgeving actief leren en helpt ze kinderen om beter te worden door te doen.
LLM’s
Tenslotte leggen de onderzoekers het verband met LLM’s. LLM’s leren passief als gevolg van hun training, terwijl leren bij mensen, met name bij kinderen, juist ontstaat door actief te verkennen en via meerdere zintuigen met de wereld om te gaan. LLM’s kunnen sterke hulpmiddelen zijn in het onderwijs en de ontwikkeling van vaardigheden bij kinderen ondersteunen. Bijvoorbeeld door fouten aan te wijzen, zonder direct het juiste antwoord op te lepelen. Door de aandacht te richten op fouten en door suggesties te geven zodat het kind ze zelf kan corrigeren. Zo kunnen LLM’s worden ingezet als hulpmiddelen die nieuwe manieren bieden om actief verder te leren en nieuwe vaardigheden te ontwikkelen. LLM’s kunnen zo dienen als krachtige hulpmiddelen die zelfcorrigerend en onderzoekend gedrag ondersteunen binnen een gestructureerde leeromgeving, zoals de ‘voorbereide omgeving’ in het Montessorionderwijs, zo stellen de onderzoekers.
