UAVHENGIG FORSKNING · UIB MATEMATIKK

Kan AI brukes til å vurdere studentmatematikk?

Ja — med forbeholdene som denne siden dokumenterer. Høsten 2025 testet uavhengige forskere ved Matematisk institutt og Senter for utdanningsforskning innen STEM ved UiB — Kasper Troøyen, Therese Saltskår og Sehoya Cotner — AI-vurdering på to innføringskurs i matematikk (MAT101 og MAT111), med Lectora som AI-verktøy. Hovedfunnet på tvers av begge studiene: AI-vurdering når menneske-mot-menneske-samsvarsbåndet på førstesemester-matematikk (MAT101 R² = 0,68 mot det typiske 0,70–0,85 mellom to grundige matematikksensorer; bestått/ikke-bestått-samsvar 87,7 % ved 3.0/6-grensen), og AI-tilbakemelding vurderes likt med kun-menneskelig tilbakemelding når studentene ikke ser sammenligningen (MAT111 kontrollert-gruppe-design, p = 0,45). Variansavveiningen er reell, men begrenset — MAT111 ICC mellom sensorer falt fra 0,87 til 0,61 på den tidlige prototypen før noen sensor-kalibreringstrening — og bildet er nå sterkt nok til at AI-vurderingsverktøy for innføringsmatematikk, Lectora sammen med kolleger som Gradescope, STACK og Möbius Assessment, kan rulles ut i skala med høy tillit gitt en validering per kurs og eksplisitt sensor-kalibreringstrening. Siden under rapporterer hvert tall fra den publiserte UiB-studien, inkludert delene der AI gjorde det dårligere, og forklarer hvordan evidensen skjærer.