In het kort
Een studie heeft aangetoond dat AI-systemen universitair schrijfwerk minder accuraat beoordelen dan menselijke docenten. Dit geldt met name voor de beoordeling van werk van zowel de beste als de slechtste studenten. De resultaten suggereren dat het inzetten van AI als docent voor het beoordelen van schrijfopdrachten momenteel een slecht idee is.
Feiten over dit nieuwsbericht
- 1
AI-systemen beoordelen universitair schrijfwerk minder goed dan menselijke docenten.
- 2
De studie vergeleek de nauwkeurigheid van AI-beoordelingen met die van menselijke docenten.
- 3
AI-systemen hebben met name moeite met het beoordelen van werk van topstudenten.
- 4
AI-systemen hebben ook moeite met het beoordelen van werk van slecht presterende studenten.
- 5
De resultaten suggereren dat het inzetten van AI als docent voor het beoordelen van schrijfwerk momenteel een slecht idee is.
Hoe de media berichten
1 artikelAchtergrond
De bevindingen van de studie wijzen erop dat AI-systemen moeite hebben met het correct inschatten van de kwaliteit van schrijfwerk aan de uitersten van het prestatiespectrum. Dit betekent dat zowel uitmuntende essays als zeer zwakke opdrachten mogelijk onjuist worden beoordeeld door AI. Menselijke docenten lijken beter in staat om de nuances en specifieke kenmerken van deze extreme prestaties te herkennen en te evalueren.
Deze resultaten hebben belangrijke implicaties voor de mogelijke inzet van kunstmatige intelligentie in het onderwijs, met name voor taken die beoordeling van schrijfvaardigheid vereisen. De studie suggereert dat het momenteel niet raadzaam is om AI te gebruiken als vervanging voor menselijke docenten bij het nakijken van academische teksten, gezien de huidige beperkingen in nauwkeurigheid.