image-10
Lektorbladet

Sensorene spriker i vurderingene

Det er ofte stort sprik mellom sensorene i vurderingen av skriftlig eksamen i norsk, språkfag og samfunnsfag på videregående skole. I matematikk og realfag er det mer samsvar.
AVRedaksjonen
05. mai, 2021
Denne artikkelen er mer enn ett år gammel

I rapporten Sensorreliabilitet på skriftlig eksamen i videregående opplæring har forskerne Julius K. Björnsson (UiO) og Gustaf B. Skar (NTNU) sett på karakterforslag fra sensorene på skriftlige eksamener i videregående opplæring. Analysene er basert på karakterforslagene fra de to sensorene som foretok ekstern sensurering, og det er sett på over 700 000 elevbesvarelser fra årene 2015–2019.

Hovedfunn

Hovedfunnene til forskerne er:

  • Sensorreliabiliteten på skriftlig eksamen i videregående opplæring varierer ganske mye.
  • Sensorreliabiliteten er stabilt høy over tid i matematikk og realfag, mens den i norsk, engelsk og samfunnsfagene er stabilt lav.
  • Det er ikke statistisk grunnlag for å skille mellom seks nivåer av kompetanse. Bruken av karakterskalaen fra 1 til 6 må granskes nærmere ettersom det tyder på at den ikke brukes fullt ut i alle fag.
  • Det mulige tolkningsfellesskapet er tilsynelatende lite i mange fag.

Det er viktig å merke seg at rapporten ikke har sett på de endelige eksamenskarakterene, men bare forslagene før sensor 1 og sensor 2 diskuterer seg fram til én karakter.

Ikke overrasket

– Jeg er ikke overrasket over at det er mye mindre samsvar i norsk, samfunnsfag og språkfag enn i matematikk og andre realfag der det er «fasitsvar». Fagenes egenart og oppgavetypene som blir gitt til eksamen legger opp til at elevene kan besvare oppgavene på mange ulike måter, og da er det nesten umulig å få fullt samsvar mellom sensorene. De vil ofte vektlegge ulike sider ved besvarelsene. Det er også et problem at sensorbetalingen ikke er god nok, og derfor deltar ikke alle på felles sensorskolering for å få signaler om hvordan de ulike oppgavene kan vurderes, sier Rita Helgesen.

Har etterlyst mer forskning

Norsk Lektorlag har lenge etterlyst mer forsking på eksamen.

– Det er bra å få mer forskning på dette feltet, men denne rapporten undersøker for smalt til å gi et godt helhetsinntrykk, sier Rita Helgesen. Hun savner en oversikt over hva resultatet ble der det var sprik mellom sensorene.

– Det ligger i både kutyme og veiledning at man går opp i karakter der sensorene ikke blir enige. En avstand i karakterforslag hos to sensorer, viser egentlig mest behovet for felles-sensurmøter, sier hun, og legger til at rapporten heller ikke tar høyde for at sensorer svært ofte går inn i fellessensuren med graderte karakterer. Det er forskjell på en svak femmer og en sterk femmer som utgangspunkt for diskusjonen. Vi mener kommende analyser bør inneholde flere forklaringsvariabler. Det bør ses på sensorskoleringen, type vurderingskriterier, type oppgaver, antall oppgaver for å kunne utarbeide og gjennomføre forbedringstiltak der det trenges, sier hun.

Helgesen mener resultatene i rapporten er et argument for at vi trenger eksamen og felles evaluering på tvers av skoler og landsdeler. De fleste som er sensorer har også egne elever, og setter standpunktkarakterer. Uten felles eksamen, felles vurderingskriterier, (obligatorisk) skolering av sensorer og at flere vurderer den samme eleven, frykter hun at ulikhetene og «urettferdigheten» vil øke ytterligere.

– Jeg tror ikke mer analytisk vurdering for eksempel i norsk er veien å gå, men med de nye og til dels uklare læreplanene, må vi ha grundige drøftinger av hvordan eksamensformen og oppgavene bør være, hvor mye som skal overlates til sensorens faglige og holistiske skjønn osv. og om deler av oppgavesettet kan/bør være mer analytisk, sier hun.

– Ellers er jeg enig i at vurderingsfellesskapet kan bli bedre for å øke kvaliteten. Det må med andre ord satses på kursing av faglærere, og det må settes av tid på skolene til faglig samarbeid om vurdering. Det vil bli ekstra viktig i fagfornyelsen, avslutter hun.

Denne spalten er publisert i Lektorbladet #2 2021.

se mer innhold fra kategorien

Lektorbladet
eksamensensorvurderingskriterier

Flere artikler du kanskje er interessert i

Informasjon
Fortsatt krevende om krenkelser
Etter fem år med den såkalte mobbeparagrafen 9 A-5 er praktiseringen verken klar eller entydig. Det er også lite debatt i lærerprofesjonene om hva som er en krenkelse.
Lektorbladet
Tillit, tid og makt – ja, takk!
Er det grunn til å tro at tillitsreformen vil bidra til at lektorene i førstelinjen gis tillit ovenfra og utenfra?
Lektorbladet
Ja, nå skal det jobbes skikkelig i skolen!
Eksamen ble avlyst for å gi elevene tid til å jobbe skikkelig med skolen. På vei inn i tidenes russefeiring, uten fraværsgrense, kan det blir en skikkelig utfordring.