Artikelen

Wat zegt een cijfer? Het waarom, wat en hoe van valide beoordelen

Wat zegt een cijfer? Het waarom, wat en hoe van valide beoordelen

“Wij geven geen cijfers.” Een uitspraak die steeds vaker voorkomt op scholen en soms ook op opleidingen. Dit onder andere vaak om af te komen van vragen als “Is dit voor een cijfer?” en om meer recht te doen aan wat leerlingen of studenten écht kunnen. Zo is het vervangen van cijfers vaak gericht op een sterkere motivatie en meer valide, ontwikkelingsgerichte kijk op leerlingen of studenten. Een goed streven, maar in hoeverre is een letter, kleur of andere beoordeling nu écht anders dan cijfers?

Waarom geven we cijfers?

Sinds wanneer en waarom we cijfers geven in het onderwijs is niet precies bekend. Voordat cijfers breed gebruikt werden was er in de negentiende eeuw het getuigschrift, een geschreven rapport. Gedurende de tweede helft van de twintigste eeuw kwamen er steeds meer scholen die cijfers gaven. Zo weten we dat veel Latijnse scholen (voorloper Gymnasium) sinds ongeveer 1880 rapporten met cijfers gingen uitdelen. Dit om inzichtelijk te maken hoe de leerlingen op de school presteerden. De reden hiervan was waarschijnlijk tweeledig: ten eerste waren relatief veel mensen in die tijd analfabeet, waardoor cijfers duidelijkheid boden. Ten tweede is er het vermoeden dat de scholen zo duidelijk konden maken hoe hun leerlingen presteerden ten opzichte van andere scholen.

Lang is het daarbij zo geweest dat er ook scholen waren die cijfers 1-5 of 1-12 gaven (Carstens, 2018). Sinds ongeveer 1920 werd in heel Nederland het cijfer 1-10 gehanteerd, al zijn daar ook altijd uitzonderingen op geweest.

Figuur 1. Schoolrapport 1922 – 1923 (onbekend)

Kijken we breder dan het onderwijs, dan vinden we als mens cijfers vaak prettig. Een reden hiervan is bijvoorbeeld dat ze een absolute schaal zijn, lekker duidelijk dus. Een andere reden is dat we in de westerse wereld veel doen aan ‘rendement denken‘: veel beroepen hebben te maken met cijfers, zoals opbrengsten, targets, successen en andere vormen van rendement. Dit met als doel het inzichtelijk maken in hoeverre iets wel of niet goed functioneert.

Dit rendement denken zit diep in onze cultuur: zelfs in het hoger onderwijs, waar cijfers minder (niet) relevant zijn. Omdat ze bij een voldoende direct worden vertaald naar studiepunten, geven we tóch cijfers (misschien voor de cum laude regeling?).

Cijfers zijn dus een manier om duidelijk aan te geven hoe iemand presteert.
Maar hoe duidelijk zijn die cijfers in het onderwijs nu écht?

Kritiek op cijfers

Figuur 2. Vijven en zessen

Al vrij snel kwam er kritiek op cijfers. Een bekende publicatie is ‘Vijven en zessen. Cijfers en beslissingen: het selectieproces in het onderwijs‘ (de Groot, 1966). In deze publicatie schrijft grondlegger van de Cito-toets dat cijfers onterecht zijn ‘gepromoveerd tot volstrekt onaantastbare, naar eer en geweten gegeven beoordelingen in een absolute schaal, beoordelingen die niet anders hadden kúnnen zijn’.

In lijn met de Groot zijn er ook tegenwoordig scholen die trachten kritisch te kijken naar cijfers. Zo wordt er regelmatig, vooral in de onderbouw van het voortgezet onderwijs, de keuze gemaakt om cijfers te vervangen met zoiets als ‘onvoldoende, voldoende, goed’ (o/v/g). Dit om zo op een andere manier duiding te geven aan prestaties. Ook worden hierbij regelmatig tools, zoals een rubric ingezet, om duiding te geven aan ontwikkeling. Alhoewel er zeker mooie voorbeelden zijn, wordt dit in de praktijk helaas vaak een nieuwe vinklijst, waarbij niet zozeer de dialoog maar het juiste hokje centraal staat.

Kritiek op de hoeveelheid cijfers

Meer dan dat zijn er scholen die niet zozeer kritisch zijn op het ‘concept cijfers’, maar des te meer over de hoeveelheid: veel scholen en opleidingen willen af van de ‘cijferdruk’ (oftewel werkdruk en prestatiedruk) en kiezen daarom bijvoorbeeld voor richtlijnen voor een maximum aantal cijfers per vak en periode.

De kritiek op het concept cijfers én de hoeveelheid cijfers wordt soms ook doorgetrokken bij het formatief handelen: cijfers worden verbonden aan summatief beslissen en dus is het niet wenselijk deze te geven bij formatieve checks, temeer omdat cijfers weinig inzichtelijk maken wat een leerling wel of niet kan. Voor dit laatste valt zeker wat te zeggen: immers, wat zegt een cijfer nu? Het is een grove samenvatting. Echter, bij het eindexamen of een tentamen krijg je ook een cijfer, dus hoe kun je weten ‘hoe hoog je kunt springen zonder te weten hoe hoog je kunt springen?’. Sterker nog, in het voortgezet onderwijs worden cijfers mede gebruikt om kwaliteit te borgen (verschil se – cse). Zo bekeken is het dan ook onnodig om cijfers te verbinden aan summatief handelen. Anders gezegd: cijfers hebben eigenlijk niks met summatief of formatief te maken.

Veel scholen en opleidingen zoeken dan ook naar de juiste hoeveelheid én vorm van cijfers, woorden of kleuren om inzichtelijk te maken hoe leerlingen of studenten presteren. Een waardevolle zoektocht, die helaas ook vaak voorbij gaat aan de belangrijkste vraag uit de alinea hierboven én waarbij oplossingen soms meer kwaad dan goed kunnen doen.

Wat zegt een cijfer?

Een middag woordjes leren of plaatsnamen leren, een avondje blokken voor een klein tentamen of 3/10 punten krijgen voor alleen al het op tijd en volledig inleveren van een verslag. Het uiteindelijke cijfer wat een leerling of student vervolgens haalt, kan gerust een 8, 9 of 10 worden, wat doet vermoeden dat hij of zij bijvoorbeeld zéér veel kennis over iets heeft… maar in hoeverre is deze kennis nog aanwezig na een week of twee? Oftewel, in hoeverre zegt het cijfer wat over de diepe verwerking van de leerdoelen of leeruitkomsten?

Stel dat een leerling of student dan een 7 haalt. Wat kan hij of zij dan goed én wat kan hij of zij dan minder goed? Bovendien gaat het cijfer vaak over het product of de handeling, in plaats van direct de onderliggende leerdoelen of leeruitkomsten. Oftewel, wat is het verhaal achter het cijfer?

Anders beoordelen?

Door een 7 naar een ‘voldoende’, ‘op niveau’ of ‘lichtgroen’ te veranderen, kunnen we nog steeds geen antwoord geven op de bovenstaande vraag: het zegt even veel, of eigenlijk weinig. In wezen gaat het om precies hetzelfde gegeven, in een nieuw jasje.

Door het aantal cijfers te verminderen, creëer je wellicht minder werkdruk en doorlopende prestatiedruk. Echter, je krijgt ook minder cijfers en heb je dus minder data. In de regel kan dit wel leiden tot minder summatieve beslissingen en dus grotere toetsen (die meer gaan over de langere termijn oftewel diep leren). Maar door deze cluster heb je nóg minder inzichtelijk wat het verhaal is achter het cijfer. Bovendien wordt absolute prestatiedruk rondom toetsen juist hoger. In wezen wordt hierbij al snel het één met het ander vervangen. Ook met deze verandering kun je zo hetzelfde probleem behouden.

Denken over data

Terug naar de kern: het beoordelen en duiden van de ontwikkeling van leerlingen en studenten. Wat zijn dan wel goede denkrichtingen? Een aantal denkstappen kunnen zijn:

1. Waartoe dient je onderwijs?

Het belangrijkste startpunt is het gezamenlijk nadenken over hoe je de ontwikkeling van je leerlingen of studenten inzichtelijk wilt maken én daar dus ook op wilt sturen. Met andere woorden: welke leerdoelen of leeruitkomsten wil je dat zij behalen? Dit gaat uiteraard over de kwalificerende doelen (kerndoelen, eindtermen, kwalificatiedossier, eindkwalificaties, etc). Oftewel: wat moeten je leerlingen of studenten kennen, kunnen of aantonen? Het is hierbij waardevol om dit vanuit backward design aan te vliegen: waar werken leerlingen uiteindelijk naartoe en hoe kun je dat vertalen naar een ’trap naar boven’?

Zo kan een concreet startpunt zijn om te denken vanuit het eindexamenprogramma (vo, mbo) of de hoofdfase (hbo). Wat hebben leerlingen of studenten nodig om daar succesvol aan te starten? Kijkend naar het voortgezet onderwijs vormt zich zo ook de basis voor valide determinatie.

Echter, alleen kwalificatie zou beperkt zijn. Vaak wil je, althans zo staat het wel in vrijwel iedere visie, breder kijken, dus ook naar de socialisatie en subjectivicatie. Alhoewel deze vaak minder sterk te vertalen zijn naar concrete leerdoelen, kunnen ze wel een kader bieden voor de begeleiding en beoordeling. Stel je bijvoorbeeld dat je samenwerking belangrijk vindt, dan zou dit regelmatig mogen terugkomen in de leeractiviteiten én de toetsing.

Probeer tot leeropbrengsten te komen op basis van de landelijke eisen, de visie én de context waarmee je binnen je school of opleiding te maken hebt.

Zo ontstaat er als het ware een lat om de beheersing langs te houden; een bril waardoor je naar de ontwikkeling gaat kijken.

2. Waarmee kun je dat inzichtelijk maken?

Als je scherp hebt wat leerlingen of studenten moeten kennen en kunnen, hoe wil je dan vaststellen of ze dit ook daadwerkelijk beheersen? Oftewel, welke informatie heb je nodig? Soms is een kennistoets het perfecte middel om kennis aan te tonen, zeker in het voortgezet onderwijs (met een centraal examen in het vooruitzicht). Soms is een presentatie of verslag (of ander type product) meer geschikt. En soms heb je meer dan één product of handeling nodig om iets goed vast te stellen en gaat het misschien juist om meerdere, kleinere handelingen die samen een goed beeld geven. Het gaat hierbij dus om producten of handelingen als middel (om leerdoelen aan te tonen), niet als doel.

Zo ontstaat er een palet aan producten en handelingen waarmee leerlingen of studenten hun beheersing kunnen aantonen.

3. Hoe wil je die ontwikkeling duiden?

Dan kom je aan bij de vraag hoe je duiding wilt geven aan de ontwikkeling. Hoe wil je duiden in hoeverre leerdoelen of leeruitkomsten worden beheerst? Bij deze stap kun je dus de keuze maken voor een presentatie met onderliggende leerdoelen die je dan als één geheel beoordeelt. Echter, is dan dus beperkt wat iemand goed en minder goed kan én beoordeel je waarschijnlijk een presentatie in plaats van de onderliggende doelen.

Het is bij deze stap dan ook belangrijk om goed na te denken over hoe je data wilt duiden. Je kunt hierbij denken aan het markeren per leerdoel, middels vooraf bepaalde producten en handelingen of het (laten) verzamelen van bewijs om leerdoelen aan te tonen (zoals een portfolio met producten of handeling of database met datapunten). Welke keuze je ook maakt, het is belangrijk om inzichtelijk te blijven houden in hoeverre leerlingen of studenten doelen beheersen, zodat je hier ook gericht op kunt begeleiden en formatief handelen.

Een uitdaging hierbij kan zijn het duiden van de meer softskills, zoals samenwerken en burgerschap of de meer algemene ontwikkeling van leerlingen of studenten, zoals het psychologisch welbevinden (Ryff, 1989). Ook hierbij is het belangrijk om na te denken óf en hoe je de ontwikkeling op dit gebied wilt meenemen in je (loopbaan)begeleiding.

Zo ontstaat er een manier van het duiden van ontwikkeling.

Constructieve afstemming met leeractiviteiten

Hoe bewust en doordacht je ook tot passende, heldere leerdoelen én een manier van beoordelen en beslissen komt, het zijn slechts veranderingen op papier. Het valt of staat met de uitvoering ervan, oftewel met de pedagogiek en didactiek. Cruciale factoren kunnen bijvoorbeeld zijn: het duidelijk communiceren van verwachtingen, het regelmatig formatief handelen, kennis over leerstrategieën en het inzetten op didactisch coachen. Het zijn aspecten die vaak de meeste impact hebben op het leren. Werk toe naar een goed constructieve afstemming, op verschillende lagen.

Figuur 3. Constructieve afstemming op alle lagen (Peeters et al., 2021)

In dialoog over beoordelen en beslissen

Terug naar de start: wat zegt een cijfer? Het is een waardevolle vraag om met elkaar daarover in gesprek te gaan. Ga dat gesprek aan en neem de tijd om stap voor stap toe te werken naar een goede manier van beoordeling en beslissen die past bij jullie landelijke eisen, visie en context, en waak ervoor te snel oude wijn in nieuwe zakken te doen.