Børne- og Undervisningsudvalget 2019-20
BUU Alm.del Bilag 82
Offentligt
2146467_0001.png
Kortlægning af sammenlignelige test
Delrapport 3: Evaluering af de nationale test
Tine Louise Mundbjerg Eriksen, Lasse Hønge Flarup og Peter Rohde Skov
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0002.png
Kortlægning af sammenlignelige test – Delrapport 3: Evaluering af de
nationale test
© VIVE og forfatterne, 2020
e-ISBN: 978-87-7119-739-6
Forsidefoto: Ricky John Molloy/VIVE
Projekt: 301403
VIVE – Viden til Velfærd
Det Nationale Forsknings- og Analysecenter for Velfærd
Herluf Trolles Gade 11, 1052 København K
www.vive.dk
VIVEs publikationer kan frit citeres med tydelig kildeangivelse.
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0003.png
Forord
Folketinget vedtog i marts 2006 indførelsen af de nationale test. Den første obligatoriske test-
runde blev gennemført i foråret 2010. De nationale test var ét blandt flere elementer i et lov-
forslag fra december 2005 om fornyelse af folkeskolen for at forbedre det faglige niveau blandt
eleverne gennem styrket, løbende evaluering i folkeskolen.
De nationale test tjener to formål: De skal fungere som et pædagogisk redskab til lærerne og
har derudover et styringsformål rettet mod såvel institutioner, kommuner og på nationalt niveau
(Undervisningsministeriet, 2005; 2006).
De nationale test tester eleverne i syv forskellige fag fra 2. til 8. klassetrin, heraf fire obligatori-
ske fag og tre frivillige fag. Samlet bliver det til 10 obligatoriske og op til 32 frivillige test i løbet
af et skoleforløb.
Testene er it-baserede og adaptive, hvilket betyder, at de tilpasser sig den enkelte elev i svær-
hedsgrad i testforløbet. Hver test består af tre faglige profilområder og er selvscorende. Der
gives tilbagemelding per profilområde samt en samlet vurdering. En test kan typisk gennemfø-
res på én lektion, svarende til 45 minutter, med mulighed for at forlænge.
De nationale test blev senest evalueret i 2013. Det blev her besluttet, at der efter en femårig
periode igangsættes en ny evaluering. VIVE udarbejder denne nye evaluering af de nationale
test.
Evalueringen har til formål at belyse styrker såvel som svagheder omkring indholdet og brugen
af de nationale test i folkeskolen samt give et vidensgrundlag, der kan danne afsæt for det
fremadrettede arbejde med udvikling og brug af de nationale test i folkeskolen. Evalueringen
svarer konkret på det følgende, overordnede evalueringsspørgsmål:
Evalueringsspørgsmål
Har de nationale tests indhold og udformning styrket skolernes evalueringskultur og derigennem
elevernes faglige niveau?
Evalueringens underordnede undersøgelsesspørgsmål udmønter sig seks rapporter og en bi-
lagsrapport: én tværgående evalueringsrapport og fem delrapporter, der omhandler hvert sit
emne, samt en bilagsrapport til delrapport 5.
Tværgående
evaluering
Delrapport 1 -
Tekniske aspekter
af testene
Delrapport 2 -
Samvariation med
karakterer
Delrapport 3 -
Sammenlignelige
test
Delrapport 4 -
Sammenhæng med
fagenes formål
Delrapport 5 -
Anvendelsen af
testene
Hver delrapport besvarer selvstændige undersøgelsesspørgsmål under det overordnede
spørgsmål. De fem delrapporter kan, ligesom den tværgående evaluering, læses selvstændigt.
De enkelte delrapporteringer besvarer følgende undersøgelsesspørgsmål:
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0004.png
Delrapport
Titel
Evaluering af de nationale test –
tværgående rapport
Undersøgelsesspørgsmål
Den tværgående rapport samler resultaterne fra de fem del-
rapporter
Har STIL på tilfredsstillende vis besvaret rådgivningsgrup-
pens evalueringsspørgsmål om de nationale tests statisti-
ske usikkerhed, reliabilitet og øvrige måleegenskaber?
Hvad er samvariationen mellem elevers præstationer i
testene og karakterer i 8. og 9. klasseprøverne?
Hvilke test findes, der i formål, indhold og omfang minder
om de danske nationale test?
I hvilket omfang er der sammenhæng mellem de nationale
test og de centrale dele af faget og fagenes formål, jf. Fæl-
les Mål?
Hvordan opleves de nationale test som evalueringsred-
skab?
Hvordan bruges de nationale test i dialogen og opfølgnin-
gen på tværs af lokale politikere, forvaltning, skoleledere,
lærere, elever og forældre?
1
Review af evalueringen af de statisti-
ske aspekter ved de nationale test
De nationale tests samvariation med
karakterer
Kortlægning af sammenlignelige test
De nationale tests sammenhæng
med fagenes formål
Anvendelsen af de nationale test
samt bilagsrapport med resultater fra
spørgeskemaer
2
3
4
5
Denne rapport er Delrapport 3: Kortlægning af sammenlignelige test. Delrapporten er særligt
relevant som sammenligningsgrundlag og til inspiration i forhold til at undersøge andre test.
Rapporten er også relevant i forhold til Delrapport 5, der behandler oplevelsen af de forskellige
karakteristika, de nationale test har, så som det dobbelte formål, længden og typen af test.
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Indhold
Sammenfatning .................................................................................................. 6
Evalueringens resultater ......................................................................................... 6
1
Indledning ................................................................................................. 9
1.1
1.2
1.3
Formål ........................................................................................................... 9
Kort om design og metode .......................................................................... 10
Læsevejledning ........................................................................................... 10
2
Testenes formål, indhold og princip ........................................................ 11
2.1
2.2
2.3
2.4
Testbeskrivelse ........................................................................................... 12
Testprincip .................................................................................................. 12
Afrapportering ............................................................................................. 14
Forbehold .................................................................................................... 14
3
Analyse ................................................................................................... 15
3.1
3.2
3.3
3.4
Testbeskrivelse ........................................................................................... 16
Testprincip .................................................................................................. 20
Afrapportering ............................................................................................. 23
Analyse af reliabilitet ................................................................................... 26
4
5
Testkortlægning ...................................................................................... 28
Design og metode ................................................................................. 159
5.1
5.2
Undersøgelsesspørgsmål, inklusions- og eksklusionskriterier ................. 159
Selektionsprocedure ................................................................................. 160
Litteratur......................................................................................................... 169
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0006.png
Sammenfatning
Som en del af evalueringen af de nationale test har denne delrapport til formål at kortlægge,
hvilke test der findes, som i formål, indhold og omfang minder om de danske nationale test.
Ved hjælp af en systematisk litteratursøgning afgrænset til litteratur omhandlende test i Eu-
ropa
1
, Nordamerika, Singapore, Japan, Sydkorea, Australien og New Zealand identificeres 106
relevante test, der efterfølgende beskrives ud fra en række karakteristika (se beskrivelse af de
enkelte test i kapitel 4).
Konkret beskriver VIVE:
Testenes grundlæggende
karakteristika
Hvor kommer testen fra? Hvem har udviklet testen? Hvad er
testens anvendelsesformål? Hvem er målgruppen? Hvilke
fag omhandler testen? Er testen opdelt i profilområder?
Hvor lang tid tager testen? Hvor mange spørgsmål indeholder
testen? Er testen adaptiv? Anvendes Item Response Theory
(IRT) til at score testen? Bruger testen åbne eller lukkede
spørgsmål? Hvordan scores testen? Eksisterer der en teknisk
rapport?
Hvem er modtager? Hvordan afrapporteres testens resulta-
ter? Hvordan visualiseres testens resultater til modtageren?
Testenes principper
Testenes afrapportering
Til grund for beskrivelserne ligger ikke vurderinger af de enkelte karakteristika, fx
faktisk an-
vendelse,
men derimod de rapporterede karakteristika, i dette tilfælde de
intenderede anven-
delsesformål.
Evalueringens resultater
Herunder præsenteres overordnede resultater og konklusioner fra denne Delrapport 3. De ba-
serer sig på en komparativ analyse af data fra de 106 beskrivelser af de identificerede relevante
test.
Beskrivende information om testene er vanskelig at rekvirere
Af de 106 identificerede test har det kun været muligt at indhente fuld information om alle ka-
rakteristika for 8 af testene. Hvor testenes overordnede karakteristika og afrapportering kan
afdækkes for langt hovedparten – mellem 85 og 100 % (undtaget er testens population og
visualisering), afdækkes der eksempelvis kun information om, hvorvidt testen bruger Item Re-
sponse Theory (IRT) for 43 % og varighed for 61 % af testene.
Hovedparten af de identificerede test kommer fra USA
56 test kommer fra USA, mens 14 test er danske. Desuden findes 13 test i resten af Norden,
13 test i Europa eksklusive Norden, 7 i de resterende undersøgte lande samt 3 internationale
test.
1
De nordiske lande, Tyskland, Belgien, Storbritannien, Frankrig, Holland,
6
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
90 % af testene målretter sig til indskolingen
90 % af testene målretter sig, om end de ikke nødvendigvis kun er udviklet til, indskolingen i
USA og Europa. I USA ses fx, at de fleste test er målrettet hele skolegangen.
Anvendelsesformålet er typisk pædagogisk
Testene er typisk tiltænkt som pædagogiske værktøjer, men uden for Europa ses også en
udpræget grad af test med styring som formål. 50 % af disse er dog tiltænkt som en kombina-
tion af et styringsredskab og et pædagogisk værktøj.
De danske nationale tests målgruppe og modtager minder om andre test med lignende
anvendelsesformål
De danske nationale test er karakteriseret ved både at være tiltænkt som et pædagogisk værk-
tøj og et styringsredskab. De er målrettet de fleste årgange på tværs af indskolingen, mel-
lemtrinnet og udskolingen. Sammenholdes disse karakteristikker med de fundne data, ses det,
at test, hvis anvendelsesformål både er som pædagogisk værktøj og styringsredskab, i høj
grad målrettes hele skolegangen, og resultaterne af testen vil i udpræget grad også rapporteres
til både hjemmet, læreren og myndighed, præcis som det også forekommer i de danske natio-
nale test.
Varigheden af de danske nationale test er kortere sammenlignet med andre test med
lignende anvendelsesformål
Er en test kategoriseret som et pædagogisk værktøj, er den typisk målrettet indskolingen eller
hele skolegangen, og testen vil maksimalt tage 45 minutter. Anvendes testen derimod alene
som et styringsredskab og ikke et pædagogisk værktøj er den målrettet mellemtrinnet og ud-
skolingen eller hele skolegangen. Her vil testen typisk tage mere end 45 minutter. Er en test
en kombination af begge anvendelsesformål, er den typisk designet til hele skolegangen, og
den vil have en tendens til at vare mere end 45 minutter. De danske nationale test varer typisk
en lektion, dvs. 45 minutter, hvilket er kortere sammenlignet med øvrige test med samme an-
vendelsesformål.
Adaptive test er ikke udpræget i Norden
Brugen af adaptive test er minimal, og generelt findes der ingen adaptive test i Norden ud over
de danske nationale test. Denne testform er altså usædvanlig, og man må forvente, at brugerne
i Norden derfor har mindre/ingen erfaring med denne type test.
Information om en tests reliabilitet er svær at indhente og sammenligne
Der blev søgt efter information om reliabilitet for 11 af testene, og generelt ses det, at det dels
er sparsomt med information både inden for og på tværs af testene, dels at der ikke er konsi-
stens i valget af reliabilitetsmål på tværs af test. Derudover er de enkelte mål meget kontekst-
afhængige. Værdierne af Standard Error of Measurement (SEM) afhænger af den underlig-
gende model, der anvendes til at score en given test. Det er med til at vanskeliggøre sammen-
ligning af SEM på tværs af test. Ligeledes vil en test-retest kunne foretages på mange forskel-
lige samples, som i større eller mindre omfang vil have betydning for korrelationen. Derfor vil
en egentlig sammenligning af en tests usikkerhed med de danske nationale test kræve en
dybere undersøgelse af hver enkelt test. Ud fra den information, der er indhentet på de 11 test,
er der ikke noget, der tyder på, at de danske nationale test har en dårligere reliabilitet end
andre test.
7
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0008.png
Datagrundlag
Rapporten er baseret på en systematisk litteratur- og tekstsøgning i elektroniske databaser. En så-
dan søgning fanger ikke alle test, da den begrænser sig til test, der senere er beskrevet/anvendt i
peer-reviewed litteratur. Det kan derfor ikke udelukkes, at der findes andre relevante test, der ikke
er fanget i den systematiske litteratursøgning, og som derfor ikke indgår i nedenstående analyse.
Datagrundlaget for den komparative analyse er de oversigtskemaer, udfyldt på baggrund af infor-
mationen om de 106 identificerede og relevante test. Testene beskrives på baggrund af et over-
sigtsskema, der 1) giver en generel beskrivelse af testens generelle karakteristika, 2) gennemgår
testprincippet såsom designet, og 3) hvordan testen afrapporteres.
8
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0009.png
1
Indledning
De nationale test er en test blandt mange i den danske folkeskole, der anvendes til at følge
elevers faglige niveau (Pedersen et al., 2018). Og testning af elevers faglige niveau er et ud-
bredt redskab på tværs af sammenlignelige lande.
For at vurdere kvaliteten af de danske nationale test er det relevant at lave en sammenligning
med det resterende testlandskab både inden og uden for Danmark. Findes der eksempelvis
test, der har samme formål og design som de danske test? Og findes der relevante alternati-
ver?
1.1
Formål
Formålet med denne Delrapport 3 er at belyse, hvilke test der findes i ind- og udland, der er
sammenlignelige i forhold til de danske nationale test. Det gøres for at skabe overblik over
lignende test, og dermed skabe mulighed for at blive inspireret til at indhente yderligere viden
om konkrete test. Konkret gøres dette ved at afdække testlandskabet i og uden for Danmark
gennem besvarelse af følgende undersøgelsesspørgsmål:
Undersøgelsesspørgsmål
Hvilke test findes, der i formål, indhold og omfang minder om de danske nationale test?
Konkret besvares spørgsmålet igennem en systematisk litteratursøgning, der kortlægger de
sammenlignelige test. Kortlægningen omfatter:
en komparativ kortlægning af de fundne test
en analyse af reliabiliteten og målepræcisionen af et udvalg af de fundne test
en systematisk beskrivelse af de fundne test i et inspirationskatalog.
I løsningsbeskrivelsen og i forbindelse med opstarten af undersøgelsen blev det mellem Børne-
og Undervisningsministeriets og VIVE afklaret, hvilke karakteristika der indgik i denne kortlæg-
ning. Disse karakteristika uddybes i kapitel 2.
Testenes reliabilitet, dvs. målepræcision, er et karakteristika, som delvist er inddraget i kort-
lægningen. Testenes reliabilitet er alene inddraget for et begrænset antal af de fundne test.
Dette valg har tre primære årsager.
For det første har de øvrige karakteristika været prioriteret i kortlægningen over reliabilite-
ten.
For det andet har det ikke været muligt at identificere testenes reliabilitet gennem den sy-
stematiske kortlægning. I en litteratursøgning forekommer oftest videnskabelige studier og
andre analyser, som anvender en given tests data, men som ikke forholder sig aktivt til
testens karakteristika.
For det tredje er der grundet ovenstående gennemført en yderligere søgning på samtlige
test efter tekniske rapporter, der beskriver testenes tekniske egenskaber.
2
Og selv i de
Idet de tekniske rapporter oftest ikke er peer-reviewed, vil de ikke kunne findes i en databasesøgning.
2
9
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
tekniske rapporter viser det sig vanskeligt at finde sammenlignelige mål for testenes relia-
bilitet på tværs af test. Kortlægningen af de tekniske rapporter muliggør yderligere under-
søgelser efter mål for testenes præcision.
I den forbindelse er det efter aftale med Børne- og Undervisningsministeriet besluttet, at kort-
lægningen af testenes målepræcision blev begrænset til 11 test. Rapportens afsnit 3.4 drøfter
resultaterne af denne søgning yderligere.
1.2
Kort om design og metode
For at afdække, hvilke test der findes i og uden for Danmark, tager kortlægningen udgangs-
punkt i en systematisk litteratursøgning efter pædagogiske og psykonometriske test, foretaget
af VIVEs forskningsbibliotek. På baggrund af denne søgning dannes et overblik over de an-
vendte test, der opfylder en række inklusions- og eksklusionskriterier. Testene beskrives her-
efter ud fra en række karakteristika udvalgt i samarbejde med Børne- og Undervisningsmini-
steriet. De valgte karakteristika giver et overblik over det samlede landskab af test, der findes
i Danmark og andre lande, og som er sammenlignelige med de danske nationale test.
Kortlægningen kan bruges som et inspirationskatalog til at afsøge erfaringer med andre test.
Litteraturhenvisningerne kan ligeledes bruges til at afsøge yderligere information om konkrete
test. Kortlægningen giver således mulighed for, at man kan identificere test, der er interessante
at søge yderligere information om, så som oplysninger om, hvilke delområder der testes i, eller
testens validitet eller reliabilitet.
Litteratursøgningen resulterede i en kortlægning af 106 relevante test.
1.3
Læsevejledning
Kapitel 2 beskriver, hvilken information der er indhentet for hver test, og præsenterer oversigts-
skemaet, der ligger til grund for inspirationskataloget. Kapitel 3 analyserer de fundne test kom-
parativt, mens inspirationskataloget er samlet i kapitel 4. Kapitel 5 beskriver metoden.
10
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0011.png
2
Testenes formål, indhold og princip
Formålet med kortlægningen er at give et overblik over de forskellige test, der anvendes i og
uden for Danmark, og som kan sammenlignes med de nationale test. Der er derfor opstillet en
række karakteristika fremstillet i nedenstående skema (se Figur 2.1), ud fra hvilke hver test
beskrives. Den komparative analyse af det samlede testlandskab gør, at det er relevant at
inddrage test, som kun i mindre grad ligner de danske nationale test. Derfor er kortlægningens
inklusionskriterier defineret, så der er relativt stor spredning i typen af test. Se yderligere om
metoden i kapitel 5.
Figur 2.1
Oversigtsskema
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Pædagogisk værktøj:
Andet:
Målgruppe:
Emne:
Population:
Fag:
Delskalaer:
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Brev:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja:
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Ja:
Nej:
Alder/klassetrin:
Styringsredskab:
Screeningsværktøj:
Offentlig:
Privat:
Forskningsinstitution:
Ovenstående oversigtsskema viser de indsamlede karakteristika. Først gives en generel be-
skrivelse af testen, derefter beskrives testens principper, og til sidst hvorledes testens resulta-
ter afrapporteres. Skemaerne er udfyldt med udgangspunkt i testudbyderens tilgængelige in-
formation. Eksempelvis vurderes testens anvendelsesformål ud fra 1) om der direkte står ”te-
sten anvendes til …” og/eller 2) via beskrivelse af testens formål. VIVE forholder sig således
ikke til, hvordan testen anvendes i praksis.
11
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0012.png
Nedenfor beskrives, hvordan udfyldelsen af skemaet er operationaliseret i forhold til de ud-
valgte karakteristika.
2.1
Testbeskrivelse
Testbeskrivelsen angiver de overordnede karakteristika af testen såsom land og målgruppe.
Figur 2.2
Testbeskrivelse: Udsnit af Figur 2.1
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelsesfor-
mål:
Navn på testen
Hvor i verden testen anvendes
Fokus på ejer/bruger. For eksempel i Sverige, hvor opdraget er den svenske regering, men
udviklingen er udliciteret til forskellige universiteter, vil testudvikleren stå som offentlig.
Kort beskrivelse af testens formål
Anvendes testen som et pædagogisk værktøj, styringsredskab, eller screeningsværktøj?
Hvor anvendelsen ikke har været eksplicit beskrevet, er vurderingen foretaget på baggrund
af testens formål og den tekst, der ellers har været adgang til. For eksempel har VIVE vur-
deret, at testen er et styringsredskab, hvis der har stået, at testen tages for at sikre, at elever
lever op til statens læringsmål, og testresultater afrapporteres til myndigheder. Ligeledes er
en test blevet vurderet som et screeningsværktøj, hvis det har stået eksplicit, eller hvis der fx
har stået, at den anvendes til at vurdere, hvorvidt en elev skal gå en klasse om. VIVE har
taget udgangspunkt i testens anvendelsesformål og forholder sig ikke til, hvordan testen er
implementeret.
Populationen, der modtager testen, samt deres alder eller klassetrin. Vi har valgt at bibeholde
de nationale klassebetegnelser, da der ikke nødvendigvis er en klar omregning til en dansk
kontekst.
Hvilke fag omhandler testen, og er testen delt op i delskalaer (i de Danske Nationale Test
benævnes de profilområder). Af hensyn til overskuelighed samt forskelle i rapporteringsprak-
sis
3
har VIVE valgt ikke at angive, hvilke delskalaer der testes. Dette betyder eksempelvis,
at to test i matematik ikke nødvendigvis er sammenlignelige, da de kan teste to forskellige
dimensioner. Dette er naturligvis et forbehold, men selv med denne information er det ikke
sikkert, at testen faktisk afdækker underliggende profilområder lige godt. Det ses eksempel-
vis i kapitel 4 (De nationale tests sammenhæng med fagene formål), hvor algebra i væsentlig
mindre grad er dækket i profilområdet tal og algebra sammenlignet med tal og regnestrate-
gier, hvorfor en sammenligning af testene alligevel ikke vil være meningsfyldt.
Målgruppe:
Emne:
2.2
Testprincip
Testprincip dykker ned i det faktiske indhold af testen. For eksempel, hvor mange spørgsmål
den enkelte elev skal besvare, hvorvidt testen er designet til at være adaptiv eller lineær, etc.
3
Nogle testudviklere skriver, at de tester flere områder, men afrapporterer kun en samlet score – andre benævner delom-
råder som alle de færdigheder og kompetencer, testen tester.
12
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0013.png
Figur 2.3
Testprincip
Indhold:
Testprincip: Udsnit af Figur 2.1
Antal items (spørgsmål) og tidsforbrug. Antal items er angivet hvis de fremgår i det under-
søgte materiale. Nogle steder er der blot noteret ”variere inden for test, hvis en beregning af
samtlige antal spørgsmål er blevet vurderet for tidskrævende.” Det samme gør sig gældende
for den estimerede tid, det tager en elev at besvare testen. Hvis en test er adaptiv men med
en tidsbegrænsning, vil tiden angive testens længde.
Angivelse af, hvorvidt der bruges Item Response Theory til at score testen med. Her tages
udgangspunkt i information om scoring. Det vil sige, hvis en test ikke skriver, at de anvender
IRT, og der ikke findes anden information om scoring, vil informationen stå som ”ikke tilgæn-
gelig.” Det kan ikke afvises, at der for nogle test ikke rapporteres IRT, fordi de ikke bruger
det. For en beskrivelse af Item Response Theory se nedenfor.
Angivelse af, hvorvidt testen er adaptiv eller lineær. For en beskrivelse af de to principper
se nedenfor.
Vurdering af, hvorvidt der anvendes åbne eller lukkede items.
Angivelse af, hvorvidt testen scores manuelt, det kan være internt eller eksternt, eller vha.
en computer. I vores testmateriale findes der test, hvor nogle delelementer scores af en
computer og andre manuelt.
Angivelse af, hvorvidt der findes en teknisk rapport på testen. Dette er særligt relevant i
forhold til at kunne afdække testprincipper samt indhente validitets og reliabilitetsmål (se
afsnit 3.4).
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
2.2.1
Item Response Theory (IRT)
Item Response Theory (IRT) refererer til en statistisk metode til at beregne et uobserverbart
karaktertræk. I testene i denne kortlægning vil det typisk være elevens dygtighed inden for et
givent emne, fx læsning. Metoden bygger på en antagelse om, at sandsynligheden for at svare
korrekt på et item afhænger af et sæt af parametre. For eksempel kan sandsynligheden for at
svare korrekt afhænge af et items sværhedsgrad, og graden hvormed et item diskriminerer
blandt individer med forskellig dygtighed. Udgangspunktet for metoden er designet af de en-
kelte spørgsmål, der skal afhænge af en række kriterier, bl.a. skal et item fungerer lige godt for
drenge og piger, hvilket vil sige, at de skal have lige stor sandsynlighed for at svare korrekt på
det. Er kriterierne opfyldt, vil metoden tillade en beregning af elevens uobserverbare dygtighed.
For mere information om IRT se (Hambleton & Swaminathan, 2013).
2.2.2
Adaptive og lineære test
En adaptiv test er en test, hvor spørgsmålene tilpasses den enkelte elevs dygtighed. I praksis
vil eleven først få nogle mere eller mindre tilfældige spørgsmål, hvorfra elevens dygtighed esti-
meres. Herefter vælges en opgave af samme sværhedsgrad som elevens estimerede dygtig-
hed. På baggrund af dette svar estimeres en ny dygtighed, eleven får en ny opgave af tilsva-
rende sværhedsgrad, og denne estimation fortsætter, indtil usikkerheden omkring den estime-
rede dygtighed er tilpas lille. To elever vil altså ikke modtage den samme test. Omvendt er en
lineær test en test med et fast sæt af spørgsmål, der ofte vil stige i sværhedsgrad, som testen
skrider frem. Alle elever vil derfor modtage den samme test.
En af fordelene ved de adaptive test er, at ingen elever vil opleve at kunne svare på det hele,
og ingen elever vil opleve, at de ikke kan svare på nogle spørgsmål, hvorimod dette kan være
tilfældet i den lineære test. Teoretisk er den adaptive test derfor bedre til at estimere elevers
dygtighed blandt de stærke og mindre stærke elever, sammenlignet med en lineær test. For
mere information om adaptive test se Delrapport 1.
13
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0014.png
2.3
Afrapportering
Afrapporteringen giver et overblik over, hvem der modtager testresultaterne, hvad de modta-
ger, og hvordan de modtager det.
Figur 2.4
Afrapportering
Modtager:
Angivelse af, hvem der modtager informationen om elevens/elevernes testresultater. Vi op-
deler på elev, forældre, lærere, og myndighed, som refererer til skolen, kommunen, staten,
etc.
Angivelse af, hvorvidt karakteren er normbaseret, kriteriebaseret, eller skaleret. Se nedenfor
for en beskrivelse af de forskellige typer af karakterer.
Hvordan informeres modtageren om testens resultater.
Afrapportering: Udsnit af Figur 2.1
Karaktergivning:
Visualisering:
2.3.1
Typer af karakterer
Skaleret karakter/score
En skaleret score er et resultat, der fx afspejler den rå score (i.e. Antal korrekte spørgsmål)
ganget op med en faktor X. Dette kan fx vælges for at skabe en større spredning i en score.
Normbaseret vurdering
En normbaseret vurdering er en karakter, der relaterer sig til en given population. Med andre
ord fortæller den, hvor godt en elev har klaret sig sammenlignet med en given population. For
eksempel kan det være, om eleven klarer sig over middel i forhold til klassen, under middel i
forhold til alle elever på lokalt eller nationalt plan etc. En normbaseret vurdering afhænger så-
ledes af populationen, man sammenlignes med.
Kriteriebaseret karaktergivning
En kriteriebaseret vurdering afspejler, hvorvidt en elev når et givent kriterie. Det kan fx være,
om eleven svarer korrekt på X antal opgaver.
2.4
Forbehold
Oversigtsskemaerne er udfyldt bedst muligt ud fra den tilgængelige information fundet gennem
den systematiske litteratursøgning, søgninger på hjemmesider og i de tekniske rapporter. Ud-
fyldningen er naturligt begrænset af de tids- og ressourcemæssige rammer, som evalueringen
af de nationale test har fungeret under. For yderligere nuancering anbefales det at afsøge
yderligere information med udgangspunkt i de opstillede referencer.
VIVE har gennem ovenstående operationaliseringer foretaget faglige vurderinger ud fra den
tilgængelige information i tvivlstilfælde. Ovenstående figurer beskriver konkrete eksempler på,
hvordan denne vurdering er foretaget.
14
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0015.png
3
Analyse
Den systematiske litteratursøgning identificerede 106 test. Hovedparten af disse kommer fra
USA. 90 % af testene er målrettet indskolingen, og de fleste test har et pædagogisk anvendel-
sesformål. Sammenholdes de nationale tests anvendelsesformål med de fundne test, deler de
målgruppe og modtager, men varer kortere tid.
Den komparative analyse viser, at det ikke er muligt at afdække alt den ønskede information,
jf. oversigtsskemaerne, for hver test. Tabel 3.1 giver et overblik over afdækningsgraden fordelt
på de forskellige inkluderede karakteristika.
Tabel 3.1
Information
Testbeskrivelse
Land/stat
Testudvikler
Formål
Anvendelse
Population
Klassetrin/alder
Fag
Delskalaer
Test Princip
Items
Tidsforbrug
IRT
Testdesign
Itemdesign
Bedømmelse
Teknisk rapport
Afrapportering
Modtager
Testresultater
Visualisering
Test i alt
Kilde:
Egne beregninger
Afdækningsgrad fordelt på karakteristika
Afdækningsgrad (%)
99
97
100
96
59
100
100
85
37
61
44
80
70
85
44
91
92
46
106
Af tabellen fremgår det, at det overordnet har været muligt at indhente generel, beskrivende
information om eksempelvis formål, målgruppe i form af alder/klassetrin, og hvilket fag testen
omhandler. Derimod har det været sværere at definere en egentlig population for testen, fx alle
folkeskoleelever eller en subsample af elever etc., sandsynligvis fordi det typisk vil være implicit
for en given test.
I forhold til testprincippet har det været væsentligt vanskeligere at afdække den udvalgte infor-
mation. Som nævnt ovenfor er den tekniske information oftest tilgængelig i tekniske rapporter.
Men som det også fremgår af tabellen, er det kun lykkedes at finde en teknisk rapport for 44 %
af testene.
15
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0016.png
Med hensyn til afrapportering er der en tendens til, at modtager og indhold ofte er beskrevet,
hvorimod der ikke fokuseret på, hvordan informationen præsenteres for brugerne.
Samlet set er det kun lykkedes at indhente fuld information på 8 ud af de 106 test. Nedenstå-
ende komparative analyse består af fire dele.
1. Testbeskrivelse, jf. afsnit 3.1
2. Testprincip, jf. afsnit 3.2
3. Afrapportering, jf. afsnit 3.3
4. Reliabilitet, jf. afsnit 3.4.
De tre første dele består af de tre overordnede temaer, der anvendes på tværs af alle 106 test.
Den fjerde del er baseret på en stikprøve blandt testene (se afsnit 1.1).
3.1
Testbeskrivelse
De fleste test kommer fra USA
Figur 3.1 viser, at de fundne test primært kommer fra USA. Dette skyldes i høj grad No Child
Left Behind (NCLB) loven (https://www2.ed.gov/policy/elsec/leg/esea02/107-110.pdf) fra 2002,
der bl.a. pålagde alle stater at teste elever i 3. til 8. klasse.
4
Derudover findes flere test i Dan-
mark sammenlignet med resten af Norden og Europa. Dette skyldes sandsynligvis afgræns-
ningen af litteratursøgningen til engelske, norske, svenske og danske tekster. Desuden er der
tre internationale test, som refererer til PISA, PIRLS og TIMMS.
Figur 3.1
60
Testenes geografiske placering
56
50
40
30
20
14
10
13
13
7
3
0
USA
Danmark
Norden ekskl.
Danmark
Europa ekskl.
Norden
Andre
International
Note:
Kilde:
Andre lande refererer til alle andre lande uden for Europa og USA, som indgår i søgekriterierne.
Egne beregninger
Testenes anvendelsesformål er typisk pædagogisk
Testenes anvendelsesformål opdeles i fire kategorier baseret på, om testen anvendes 1) som
pædagogisk værktøj, 2) styringsredskab, 3) screeningsværktøj samt 4) pædagogisk redskab
4
I 2015 blev loven erstattet af Every Student Succeeds Act (ESSA), som stadig pålægger stater at teste elever i 3.-8.
klasse.
16
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0017.png
og styringsværktøj. Kategorierne er ikke gensidigt uafhængige, da test kan være målrettet flere
anvendelser. Af de 102 test, hvor information om anvendelsesformål kan indhentes, anvendes
78 % som et pædagogiske værktøj, 18 % anvendes til styring og 17 % anvendes som et scree-
ningsværktøj. Derudover identificeres 8 test (8 %), der både anvendes til styring og som pæ-
dagogisk værktøj. Der eksisterer altså test, om end det er relativt få, der ligesom de danske
nationale test både har et pædagogisk og styringsmæssigt formål.
For at søge, om testens anvendelsesformål afspejler forskellige testtraditioner, opdeles analy-
sen i USA, Danmark, Norden eksklusive Danmark, Europa (ekskl. Norden) og resten af verden.
Langt de fleste test anvendes som et pædagogisk værktøj på tværs af geografi jf. Figur 3.2.
Elever testes i højere grad med styring for øje uden for Norden. I USA er omkring 20 % af
testene et styringsredskab, men det fremgår samtidig, at halvdelen af disse test også anvendes
som et pædagogisk værktøj. Som forventet findes ingen test i Danmark, der anvendes som
styringsredskab (de danske nationale test er udeladt af litteratursøgningen jf. opgaveforståel-
sen).
Som det fremgår ovenfor er alle stater i USA pålagt at teste deres elever i 3.-8. klasse jf.
NCLB/ESSA, og elevernes resultater bliver blandt andet brugt til styring af skolerne fra sta-
tens/den føderale regerings side.
5
Testene er altså i høj grad implementeret med styring som
formål. Det kan derfor virke besynderligt, at så få test i USA anvendes til styring. En forklaring
herpå er for det første, at litteratursøgningen ikke identificerer en test for hver enkelt stat. For
det andet ses der også eksempler på statslige test, hvor det officielle formål ikke refererer til
styring, men alene til pædagogiske formål. I disse tilfælde har VIVE vurderet testen til kun at
være et pædagogisk værktøj, da det ikke har været muligt at bedømme testenes faktiske an-
vendelse, men alene deres officielle beskrivelse.
Anvendelsen af screeningsværktøjer er heller ikke udbredt i Danmark jf. Figur 3.2. Ud fra et
definitionsmæssigt perspektiv kan det også være vanskeligt at skelne imellem et pædagogisk
værktøj og et screeningsværktøj, da screening kan anvendes i pædagogiske sammenhænge.
Udgangspunktet i denne kortlægning har som nævnt i Figur 2.2 kun benævnt et instrument
som et screeningsværktøj hvis det har stået direkte i beskrivelsen af testen, eller hvis det har
været anvendt til at vurdere, om en elev skulle gå en klasse om, var ordblind, etc.
5
NCLB krævede, at stater rangerede alle folkeskoler i forhold til, hvorvidt de nåede statssatte målsætninger om ”Adequately
yearly progress (AYP),” samt indførte belønnings- og sanktioneringssystemer baseret på en skoles AYP. For eksempel
kunne en skoleleder risikere fyring, såfremt en skole ikke opnåede AYP flere år i træk (Dee & Jacob, 2011).
17
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0018.png
Figur 3.2
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
Testenes anvendelsesformål
USA
Danmark
Norden (ekskl. DK)
Europa (ekskl.
Norden)
Andre lande
Pædagogisk værktøj
Screeningsværktøj
Note:
Styringsredskab
Pædagogisk værktøj & styringsredskab
Kilde:
Kategorierne er ikke gensidigt uafhængige og kan derfor summe til mere end 100. Information om anvendelsesformål
findes for 55 test i USA, 14 test i Danmark, 11 test i Norden (ekskl. DK), 13 test i Europa (ekskl. Norden) og 6 test i
Andre lande.
Egne beregninger
De fleste test er målrettet indskolingen
For at give et overblik over testenes målgruppe er de opdelt i indskolingen (0.-3. klasse), mel-
lemtrinnet (4.-6. klasse) og udskolingen (6.-9. klasse eller ældre). Igen er grupperne ikke gen-
sidigt udelukkende, så en test kan altså være målrettet både mellemtrinnet og udskolingen.
Figur 3.3 viser måske overraskende, at test i indskolingen er særdeles udbredt i USA og Eu-
ropa, hvor over 90 % af de fundne test er målrettet denne gruppe af elever. I USA er det tydeligt,
at de fleste test er målrettet hele skolegangen, hvilket sandsynligvis afspejler NCLB/ESSA,
hvorimod der er et tydeligt fald i antallet af test i Danmark målrettet elever, jo ældre de bliver.
18
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0019.png
Figur 3.3
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
Målgruppe
USA
Danmark
Indskolingen
Norden (ekskl. DK)
Udskolingen
Mellemskolen
Europa (ekskl.
Andre lande
Norden)
Hele skolegangen
Note:
Kilde:
Information om målgruppe har kunnet rekvireres for 56 test i USA, 14 test i Danmark, 13 test i Norden (ekskl. DK),
13 test i Europa (ekskl. Norden) og 7 test i Andre lande.
Egne beregninger
Pædagogiske test målrettes i højere grad indskolingen, mens test med styringsformål
adresseres mellemtrinnet og udskolingen
Figur 3.4 opdeler målgrupperne på tværs af anvendelsesformål. Pædagogiske værktøjer refe-
rerer til test, der anvendes pædagogisk og ikke til styring, omvendt refererer styringsredskab
til test, der anvendes til styring og ikke som pædagogisk redskab. ”Andet” omfatter de test, der
hverken anvendes som pædagogisk værktøj eller styringsredskab. Det vil sige, at der ikke
skelnes imellem, om en test kun anvendes pædagogisk (til styring) eller samtidig bruges til
screening. Det betyder, at kategorien ”Andet” hovedsagligt refererer til de test, der alene an-
vendes som screeningsværktøjer. Af Figur 3.4 fremgår det, at langt de fleste test er målrettet
hele skolegangen. Test, der udelukkende er målrettet indskolingen, vil altid have et pædago-
gisk- eller screeningsformål, hvorimod de test, der målrettes mellemtrinnet og udskolingen, i
højere grad vil have styring for øje. Der er således en sammenhæng mellem testens ønskede
anvendelsesformål og målgruppen, hvor pædagogiske test i højere grad målrettes indskolin-
gen, mens test, der anvendes som styringsredskaber, i højere grad adresseres mellemtrinnet
og udskolingen.
Det kan altså generelt konkluderes, at test i indskolingen er udpræget, men at det samtidig
hovedsagligt er med et pædagogisk formål for øje. Sammenholdes Figur 3.4 med de danske
nationale test, som både skal fungere som et styringsredskab og et pædagogisk værktøj, er
det også mest almindeligt at teste på tværs af alle årgange i andre test med samme anvendel-
sesformål.
19
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0020.png
Figur 3.4
Målgruppe fordelt på anvendelsesformål
Andet
Pæd. værktøj og styringsredskab
Styringsredskab
Pædagogisk værktøj
0%
Indskolingen
Indskolingen og mellemskolen
Note:
10%
20%
30%
40%
50%
60%
70%
80%
90% 100%
Mellemskolen
Mellemskolen og udskolingen
Udskolingen
Alle
Kilde:
Pædagogiske værktøjer er test, der anvendes pædagogisk og ikke til styring, omvendt refererer styringsredskab til
test, der anvendes til styring, og ikke som pædagogisk redskab. Andet omfatter de test, der hverken anvendes som
pædagogisk værktøj eller styringsredskab (dvs. hovedsagligt screening). I alt observeres 12 test med ”Andet” an-
vendelsesformål, 9 test, der fungerer som både et styringsredskab og pædagogisk værktøj, 9 test, der kun anvendes
til styringsredskab, og 72 test, der anvendes som pædagogisk værktøj.
Egne beregninger
3.2
Testprincip
Som nævnt ovenfor er har det været svært at finde information omkring testenes principper,
hvorfor Figur 3.5 og Figur 3.8 også præsenterer information omkring andelen af test, for hvilke
informationen ikke er tilgængelig. For eksempel kan man forestille sig, at utilgængelig informa-
tion omkring, hvorvidt en test er lineær, i højere grad skyldes, at en testudbyder anser den
information for implicit: er testen ikke adaptiv, er den per definition lineær.
Brugen af adaptive test er begrænset
Det fremgår af Figur 3.5, at lineære test er det mest udbredte testdesign på tværs af alle lande,
og det lader ikke til, at det skyldes, at information om, hvorvidt en test er adaptiv eller lineær,
ikke har været tilgængelig. I Norden er ingen af de fundne test adaptive (og informationen er
kun utilgængelig for én test), og i resten af verden ligger andelen på knap 20 % Det vil sige, de
danske nationale test er den eneste test i Norden, der anvender et adaptivt design.
20
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0021.png
Figur 3.5
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
Testdesign
USA
Danmark
Adaptiv test
Norden (ekskl. DK)
Lineær test
Europa
Andre lande
Missing testdesign
Note:
Kilde:
Information omkring design har kunnet identificeres for 45 test i USA, 13 i Danmark, 10 i Norden (ekskl. DK), 12 i
Europa og 4 i Andre lande.
Egne beregninger
Det har kun været muligt at indhente information om, hvorvidt en test anvender Item Respons
Theory (IRT) for 47 test svarende til 44 %(heraf kun én i Norden). Af de test anvender 85 %
IRT i scoring af testen. Et relevant spørgsmål er, om manglen på information skyldes en implicit
antagelse om, at der ikke anvendes IRT – med andre ord skrives det kun, hvis det anvendes.
Hvis dette er tilfældet, vil et konservativt estimat, hvor det antages at en test ikke anvender IRT
hvis det ikke noget sted fremgår hvordan den scores, resulterer i at mere end en tredjedel af
alle testene anvender IRT.
Danmark minder mest om USA i brugen af åbne og lukkede spørgsmål
Figur 3.6 angiver, hvorvidt en test anvender åbne eller lukkede spørgsmål eller en kombination.
Ifølge den indhentede information er Danmark det land, der er mest tilbøjelig til at designe test
med lukkede spørgsmål, om end knap 30 % af de danske test anvender spørgsmål der både
er lukkede og åbne. Det danske testdesign minder altså her mest om det amerikanske. I resten
af Norden, Europa og lande uden for USA er anvendelsen af åbne spørgsmål markant mere
udbredt.
21
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0022.png
Figur 3.6
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
Itemdesign
USA
Danmark
Norden (ekskl. DK)
Europa (ekskl.
Norden)
Andre lande
Åbne spørgsmål
Note:
Kilde:
Lukkede spørgsmål
Åbne og lukkede spørgsmål
Information omkring design har kunnet identificeres for 36 test i USA, 12 i Danmark, 8 i Norden (ekskl. DK), 10 i
Europa og 5 i Andre lande.
Egne beregninger
Manuel bedømmelse er mest udbredt i Europa og USA
Af Figur 3.7 fremgår det, at den manuelle bedømmelsesform er mest udbredt i Europa og USA.
Igen minder danske test mest om test i USA, hvor omkring 50 % af testene bedømmes manuelt,
ca. 30 % bedømmes af en computer, og 15 % bedømmes både manuelt og af en computer.
Sammenlignet med resten af Norden er bedømmelse via computer betydeligt mere udbredt i
Danmark.
Figur 3.7
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
USA
Danmark
Manuelt
Note:
Kilde:
Bedømmelsesform
Norden (ekskl. DK)
Computer
Europa (ekskl.
Norden)
Andre lande
Manuelt og Computer
Information omkring bedømmelsesform har kunnet identificeres for 47 test i USA, 14 i Danmark, 13 i Norden (ekskl.
DK), 11 i Europa og 4 i Andre lande
Egne beregninger
22
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0023.png
Test med styring som anvendelsesformål varer typisk mere end én lektion
Oversigtsskemaerne angiver den rapporterede varighed for de test, hvor denne information
har været tilgængelig (61 % af testene jf. Tabel 3.1). For at skabe et bedre overblik er den
anvendte tid inddelt i 45 minutter eller mindre svarende til en undervisningslektion i Danmark.
Samlet set er fordelingen 50/50, når det kommer til testenes varighed. Opdeles varigheden på
anvendelsesformål, ses det tydeligt, at test med pædagogiske formål generelt varer kortere tid
end test med andre formål (Figur 3.8). Desuden fremgår det, at test, der kun anvendes som
styringsredskab, alle tager mere end 45 minutter at gennemføre. De danske nationale test
varer altså forholdsvis kort tid (der er en forventning om, at de danske nationale test gennem-
føres på én undervisningstime) sammenlignet med andre test med lignende formål.
Figur 3.8
Testens varighed fordelt på anvendelsesformål
Andet
Pæd. værktøj og styringsredskab
Styringsredskab
Pædagogisk værktøj
0%
10%
20%
30%
> 45 min
40%
50%
60%
70%
80%
90% 100%
≤ 45 min.
Note:
Missing tid
Kilde:
Pædagogiske værktøjer er test, der anvendes pædagogisk og ikke til styring, omvendt refererer styringsredskab til
test, der anvendes til styring, og ikke som pædagogisk redskab. Andet omfatter de test, der hverken anvendes som
pædagogisk værktøj eller styringsredskab (dvs. hovedsagligt screening). I alt observeres 8 test med ”andet” anven-
delsesformål, 7 test, der fungere som både et styringsredskab og pædagogisk værktøj, 5 test, der kun anvendes til
styringsredskab, og 45 test, der kun anvendes som pædagogisk værktøj.
Egne beregninger
3.3
Afrapportering
Læreren er den hyppigste modtager af testresultaterne
Det fremgår af Figur 3.9, at læreren er langt den hyppigste modtager af resultaterne (læreren
er ifølge oversigtsskemaer modtager i 92 % af testene). Hjemmet modtager information om
testresultaterne i halvdelen af alle test i USA og i en femtedel i Danmark. Det er mest udbredt
at informere myndigheden uden for Europa.
23
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0024.png
Figur 3.9
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
Testenes modtager
USA
Danmark
Norden (ekskl. DK)
Lærer
Europa (ekskl.
Norden)
Andre lande
Elev/forældre
Note:
Kilde:
Myndighed
Kategorierne er ikke gensidigt uafhængige. Information omkring design har kunnet identificeres for 53 test i USA, 14
i Danmark, 12 i Norden (ekskl. DK), 11 i Europa og 4 i Andre lande.
Egne beregninger
Er anvendelsesformålet et pædagogisk værktøj, vil læreren altid modtage information
om testresultater
I 40 % af testene observeres der flere modtagere. Dette fremgår tydeligt i
Figur 3.10,
hvor
modtageren af testinformationen er fordelt på anvendelsesformål. Anvendes testen som et
pædagogisk værktøj, vil læreren være en af modtagerne og i de fleste tilfælde den eneste
modtager. Har testen flere formål, informeres typisk alle interessenter. Er en test derimod kun
målrettet styring, vil myndigheden modtage informationen, men i ca. 50 % af tilfældene infor-
meres også elev/forældre og læreren. Sammenholdes dette med de danske nationale test, ses
det, at afrapportering til alle interessenter også er almindelig blandt andre test, når en test både
har styring som formål men samtidig også skal anvendes som et pædagogisk redskab.
24
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0025.png
Figur 3.10
Modtager fordelt på testens anvendelsesformål
Andet
Pæd. værktøj og styringsredskab
Styringsredskab
Pædagogisk værktøj
0%
Læreren
Note:
10%
20%
30%
40%
50%
60%
70%
80%
90% 100%
Alle
Myndighed
Elev/forældre og læreren
Læreren og myndighed
Kilde:
I alt observeres 11 test med ”andet” anvendelsesformål, 7 test, der fungere som både et styringsredskab og pæda-
gogisk værktøj, 10 test, der kun anvendes til styringsredskab, og 66 test, der anvendes som pædagogisk værktøj. I
alt observeres information omkring modtageren og anvendelsesformål i 89 % af testene.
Egne beregninger
De danske nationale test ligner i målgruppe og modtager andre test med samme an-
vendelsesformål, men de varer i kortere tid
De danske nationale test er karakteriseret ved at være både et pædagogisk værktøj og et
styringsredskab. De er målrettet de fleste årgange på tværs af indskolingen, mellemtrinnet og
udskolingen. De er adaptive, IRT-scoret og varer typisk én lektion.
Sammenholdes disse karakteristikker med de fundne data, ses det, at test, der anvendes både
som pædagogisk værktøj og styringsredskab, i høj grad målrettes hele skolegangen, og resul-
taterne af testen vil i udpræget grad også rapporteres til både hjemmet, læreren og myndighed,
præcis som det også forekommer i de danske nationale test.
Af vores data fremgår det dog, at test med bl.a. styring som formål typisk varer mere end 45
minutter, hvilket er længere end den danske forventning om, at en national test typisk skal vare
en enkelt lektion for flertallet, dvs. 45 minutter. Sammenholdes denne information med lærere
og elevers opfattelse af, at testen i indskolingen tager for lang tid (se Delrapport 5), tyder noget
på, at anvendelsesformål og varighed er svært forenelige, i hvert fald i indskolingen.
Anvendelsen af den adaptive testform er også stærkt begrænset. I Norden findes, via. littera-
tursøgningen, fx ikke andre end de danske nationale test, hvorfor der må forventes, at brugerne
har mindre erfaring med denne testform. Ifølge Delrapport 5 er lærerne endvidere generelt ikke
positivt indstillet over for den adaptive testform. Set i lyset af, at en adaptiv test teoretisk vil
være kortere end en lineær test, idet der opnås et mere præcist estimat af elevers dygtighed
pba. færre spørgsmål (se afsnit 2.2.2), tyder det altså også her på uoverensstemmelser i an-
vendelsesformål, opfattet varighed og testform.
25
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0026.png
3.4
Analyse af reliabilitet
Kortlægningen belyser, som tidligere beskrevet, om der findes andre test i og uden for Dan-
mark, der måler mere præcis end de danske nationale test for et mindre antal test. I gennem-
gangen af de udvalgte test viser det sig, at det ikke er muligt at identificere mål for præcisionen
på flere af testene.
Reliabiliteten af en test indikerer, hvor præcist testen måler det, der skal måles.
6
For eksempel:
hvor præcist måler de danske nationale test i læsning elevers læseevner?
Vi måler reliabiliteten
via to aspekter:
Indre konsistens, og Stabilitet.
Derudover angives en tests Standard Error of
Measurement (SEM), der måler, hvor stor variation der er i mellem testens estimerede score
og elevens sande evne. SEM kan ses som en kombination af testens reliabilitet og standard-
afvigelse. Test med store standardafvigelser vil alt andet lige have større SEM. Ligeledes vil
test med lav reliabilitet alt andet lige have større SEM.
Den indre konsistens angiver, om der er en sammenhæng mellem de spørgsmål, der skal måle
en faktor eksempelvis læsning. Dette belyses via Cronbach’s
α,
der indikerer, hvor meget en
skala ændrer sig, hvis et item udelades eller inkluderes i en skala. Cronbach’s
α
antager en
værdi imellem 0 og 1, hvor 1 indikerer perfekt sammenhæng, og en tommelfingerregel er, at
værdien skal være over 0,7 for at sikre indre konsistens. Split-half metoden undersøger ligele-
des den interne konsistens ved at opdele testitems i to lige store dele og beregne testresulta-
terne for hver halvdel. Herefter beregnes Spearman-Brown koefficienten imellem dem. Lige-
som Cronbach’s
α
vil Spearman Brown koefficienten antage værdier mellem 0 og 1, hvor 1
indikerer perfekt sammenhæng.
Testens stabilitet undersøger, hvorvidt man vil opnå det samme resultatet i testen ved gen-
tagne målinger. Dette gøres ved en test-retest. Optimalt anvendes den samme test, taget af
de samme personer men på to eller flere forskellige tidspunkter. Realistisk set er det svært at
få de samme elever til at tage den samme test flere gange, og typisk vil man se, at der anven-
des testresultater fra forskellige årgange på samme klassetrin. Sammenhængen mellem de
forskellige test beregnes oftest ved hjælp af en Pearson korrelationskoefficient, der antager
værdier mellem -1 og 1. Jo højere værdi, desto større stabilitet af testen.
Som med resten af oversigtsskemaet forsøgte VIVE at finde information om de ovenfor nævnte
reliabilitetsmål for hver enkelt test. Men efter gennemgang af 11 test i vores oversigt stod det
klart, hvor svært og tidskrævende det var at rekvirere den relevante information. Tabel 3.2
præsenterer en oversigt over de informationer, det lykkedes at finde. Øverst præsenteres først
reliabilitetsmål for de danske nationale tests baseret på STILs evaluering af de statistiske
aspekter ved de nationale test, jf. Delrapport 1.
Generelt ses det, at det dels er sparsomt med information både inden for og på tværs af te-
stene, dels at der ikke er konsistens i valget af reliabilitetsmål på tværs af test. Derudover er
de enkelte mål meget kontekstafhængigt. For eksempel kan man stille spørgsmål ved, at Re-
naissance Learning STAR Reading vælger at rapportere statistik over testen fra 2006 og
2008/09 til 2009/10 i en teknisk manual fra 2016. Ovenfor fremgår det, at Standard Error of
Measurement (SEM) afhænger af standardafvigelsen på en test, som igen afhænger af den
skala, der måles på. Dette illustreres i SEM for Renaissance Learning STAR Reading, hvor
6
Reliabiliteten forholder sig ikke til validiteten – hvorvidt instrumentet indfanger det, som det påstår at måle. For eksempel
Måler de danske nationale test i læsning elevers læseevner?
Det vil sige, når reliabiliteten af en test undersøges i neden-
stående skema, indgår der ikke en vurdering af, om testen også indfanger fx læseevner. Man kan forestille sig en situation,
hvor en test måler ”noget forkert”, men måler det præcist.
26
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0027.png
SEM tydeligvis måles på en anden skala. Derudover er der en klar sammenhæng mellem an-
tallet af opgaver, eleven besvarer, og SEM, hvorfor en tests varighed/længde også spiller en
relevant rolle i vurderingen af reliabiliteten. På baggrund af informationen i Tabel 3.2 er der
ikke noget, der tyder på, at de danske nationale test har en lavere reliabilitet en andre test.
Men for at lave en vurdering af, hvorvidt en test måler mere præcist end de nationale test,
kræves en mere dybdegående analyse af tilgængelige tekniske rapporter inklusive en vurde-
ring af kvaliteten af reliabilitetsmål og de valgte samples for at sikre et validt sammenlignings-
grundlag. Nærværende kortlægning er med til at identificere, hvor denne viden kan findes. Se
endvidere Delrapport 1 ”Review af evalueringen af de statistiske aspekter ved de nationale
test”, som er en del af VIVEs samlede evaluering af de nationale test.
Tabel 3.2
Testnavn
Danske Nationale
Test
Rekvireret information på testenes reliabilitet
SEM
0,46
Cron-
bach’s α
Split-
half
Test-re-
test
Læsning:
0,66-0,85
Mat: 0,63-
0,68
Note
Test-retest foretaget af BUVM i 2016 på de frivil-
lige test.
AzMerit/AzM2
ELA: 0,90-
0,91
MAT:
0,92-0,93
ELA: 0,83-
0,84
MAT:
0,79-0,86
0,918
0,829
Målt mellem to på hinanden efterfølgende klasse-
trin/år (fra 2017-2018)
Renaissance Lear-
ning STAR Reading
Renaissance Lear-
ning STAR math 34
DIBELS (US)
26,28-
81,44
0,829
Test-retest baseret på US af testgengangere fra
2008/09 til 2009/10. Reliabiliteten er beregnet for
hver årgang i UK sample af test fra 2006.
Beregninger baseret på STAR Math 2.0 norms
sample
Test-retest er foretaget for de forskellige delska-
laer, og ikke alle delskalaer indgår i alle år. Testen
er baseret på en sample af testtagere i 2017 og
sammenligner scores i begyndelsen af skoleåret
med scores i midten af skoleåret (enkelte steder
sammenlignes scores fra midten af skoleåret med
scores fra slutningen af skoleåret).
Ingen tilgængelige oplysninger
Ingen tilgængelige oplysninger
Ingen tilgængelige oplysninger
0,89-0,97
0,73-0,80
0,64-0,94
Nationale prøver
(Sverige)
Nationale prøver
(Norge)
National Assessment
of Educational Pro-
gress (NAEP)
National Assessment
(Australien)
ELA: 0,68-
0,96
MAT:
0.89-0.90
Canadian Achieve-
ment Test
PISA
TIMSS
Grade 4:
0,78-0,93
Grade 8:
0,83-0,88
0,16-0,55
Der kunne findes en SEM kurve for year 5 reading
(ikke medtaget her).
SEM er beregnet inden for hvert level. SEM bliver
væsentligt højere, når forfatterne prøver at be-
regne statistikken på tværs af læringsmål.
Cronbach’s α er international median. Statstikker
er baseret på testen i 2015
27
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
4
Testkortlægning
Dette kapitel indeholder beskrivelser af de test der blev identificeret via litteratursøgningen. Der
henvises til kapitel 2 for en beskrivelse af skemaet som hver test er beskrevet ud fra.
Arizona’s Measurement of Educational Readiness to Inform Teaching
(AzMerit/AzM2) ........................................................................................... 31
Renaissance Learning STAR reading................................................................... 32
Renaissance Learning STAR math....................................................................... 34
Dynamic Indicators of Basic Early Literacy Skills (DIBELS) ................................. 36
Nationale prøver (Sverige) .................................................................................... 39
Nationale prøver (Norge) ...................................................................................... 42
National Assessment of Educational Progress (NAEP) ........................................ 44
National Assessment (Australien) ......................................................................... 46
National Foundation for Educational Research (NFER) Tests ............................. 48
Canadian Achievement Test (CAT4) .................................................................... 49
Programme for International Student Assessment (PISA) ................................... 50
Trends in International Mathematics and Science Study (TIMMS) ...................... 53
Progress in International Reading Literacy Study - PIRLS ................................... 55
Tennessee Comprehensive Assessment Program (TCAP) ................................. 58
Montana Comprehensive Assessment System .................................................... 59
Oregon Assessment of Knowledge and Skills ...................................................... 60
Measures of Academic Progress (MAP) ............................................................... 61
Wechsler Individual Achievement Test (WIAT) .................................................... 63
Woodcock-Johnson IV Tests of Achievement ...................................................... 65
Woodcock Reading Mastery Tests ....................................................................... 67
Texas State Assessment/STAAR Reading ........................................................... 68
Fountas and Pinnell Benchmark Assesment Systems ......................................... 70
Partnership for Assessment of Readiness for College and Career (PARCC) ...... 71
Stanford Achievement Test (SAT) ........................................................................ 72
Gates-MacGinitie Reading Tests (GMRT) ............................................................ 74
Diamant (basal matematik) ................................................................................... 76
Developmental Reading Assessment (DRA) ........................................................ 77
Reading Inventory and Scholastic Evaluation ...................................................... 78
Kaufmann Test of Educational Achievement ........................................................ 79
Kartleggingsprøver ................................................................................................ 80
Standardiseret test i avkoding og stavning (STAS) .............................................. 81
North Carolina End of Grade Assessment of Reading Comprehension
(NCEOG) .................................................................................................... 82
Missouri Assessment Program (MAP) .................................................................. 83
Common Core standardized test .......................................................................... 84
Florida Reading Assessment (FRA) ..................................................................... 85
Matematikprofilen .................................................................................................. 86
Individuel Læseundersøgelse – basis (IL-basis) .................................................. 87
28
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
ACT Reading Aspire Assessments ....................................................................... 88
Curriculum-Based Measure test (CBM-Maze) ...................................................... 89
Gray Oral Reading Tests (GORT-5) ..................................................................... 90
Test of Word Reading Efficiency (TOWRE-2)....................................................... 91
World-Class Instructional Design and Assessment-Assessing Comprehension
and Communication in English State to State (WIDA-ACCESS) ............... 92
Carlstenprøverne .................................................................................................. 93
National Assesment Study .................................................................................... 94
Periodic National Assessment (PPON) ................................................................. 95
New Mexico Standards-based Assessment ......................................................... 96
Provincial Achievement test .................................................................................. 97
Primary School Leaving Examination (PSLE) ...................................................... 98
Tinfolec .................................................................................................................. 99
Terra Nova .......................................................................................................... 100
Multiple-Choice Online Causal Comprehension Assessment (MOCCA) ........... 101
Zahlenverarbeitung und Rechnen bei Kindern (Zareki-R) .................................. 102
FastaReada ......................................................................................................... 103
Neale Analysis of Reading Ability (NARA-3) ...................................................... 104
DL-prøven (Diagnostisk læse- og staveprøve) ................................................... 105
Online RAW-test ................................................................................................. 106
Wide Range Achievement .................................................................................. 107
Matematik Grundlæggende, Færdigheder Grundlæggende (MG/FG) ............... 108
South Carolina College-and-Career Ready Assesments – English Language Arts
(SC READY ELA) ..................................................................................... 109
Matematikvurdering............................................................................................. 110
LäsEttan .............................................................................................................. 111
Lesesenterets staveprøve ................................................................................... 113
Ordkjedetesten .................................................................................................... 114
Louisiana Educational Assessment Programme (LEAP).................................... 115
Alle Teller! ........................................................................................................... 116
Sætningslæse-prøverne (SL-prøverne) .............................................................. 117
Waterford Assessment of Core Skills ................................................................. 118
Læringsstøttande prøver ..................................................................................... 119
Seria-Think Instrument ........................................................................................ 120
Mississippi K-3 Assessment Support System (MKAS
2
) ...................................... 121
The AIMS-web R-Maze ....................................................................................... 122
Observation Survey of Early Literacy Achievement (OSELA) ............................ 123
EVALD – Evaluering af Læseforståelse og Delfærdigheder............................... 124
Canadian Test of Basic Skills (CTBS) ................................................................ 125
Heidelberger Rechentest .................................................................................... 126
Pennsylvania System fo School Assessment (PSSA) ........................................ 127
New York State Math Test (NYS Math Test) ...................................................... 128
Udredning af læseforståelse (ULF) ..................................................................... 129
29
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Group Reading Assessment & Diagnostic Evaluation (GRADE) Test ............... 130
Skriftsproglig udvikling ........................................................................................ 131
Comprehensive Test of Phonological Processing (CTOPP-2) ........................... 132
Test of Early Reading Ability (TERA) .................................................................. 133
KeyMath-3 Diagnostic Assessment .................................................................... 134
Test of Mathemathical Abilities (TOMA-3) .......................................................... 135
Independent Reading Level Assessment (IRLA) ................................................ 136
Consortium on Reading Excellence-Phonics Survey (CORE-PS)...................... 137
Ordstillelæsningsprøverne .................................................................................. 138
Touchstone's Degrees of Reading Power Test .................................................. 139
Florida Standards Assessment (FSA) ................................................................. 140
Make-A-Dice ....................................................................................................... 141
Virginia Standards of Learning Assessment ....................................................... 142
Mathematical School Readiness (MSR) Test ..................................................... 143
Process-Oriented Syntactic Skills Test ............................................................... 144
Smarter Balanced Assessment Consortium ....................................................... 145
GL Assessment: Progress in English Test.......................................................... 146
Ordlæseprøve ..................................................................................................... 147
ST (stavning) prøver ........................................................................................... 148
MAT (Matematik) prøver ..................................................................................... 149
Gyldendals webprøver ........................................................................................ 150
The California Assessment of Student Performance and Progress (CAASPP) . 151
Ohio Standardized Tests (OST).......................................................................... 152
English Language Proficiency Assessments for California (ELPAC) ................. 153
English Language Proficiency Assessment for the 21st Century (ELPA21) ...... 154
Georgia Milestones Assesment System ............................................................. 155
Peabody picture vocabulary test – V .................................................................. 156
Forældede test .................................................................................................... 157
30
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0031.png
Arizona’s Measurement of Educational Readiness to Inform Teaching
(AzMerit/AzM2)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Arizona’s Measurement of Educational Readiness to Inform Teaching (AzMerit/AzM2)
USA/Arizona
Offentlig:
Privat:
Forskningsinstitution:
At vurdere, hvorvidt elevens kompetencer ift. de statsligt fastsatte læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn (folkeskoler inkl.
Charter og distriktsskoler)
Fag: English Language Arts (ELA) og matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 47 (ELA), 45-47 (Mat)
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
American Institute for Research & Arizona Department of Education, 2018,
Annual Technical
Report – Arizona Statewide Assessment in English Language Arts and Mathematics.
District of Columbia: American Institute for Research.
Arizona Department of Education, 2019,
AzM2.
Tilgængelig på: https://www.azed.gov/asses-
sment//azm2/. Besøgt d. 18-09-2019.
31
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0032.png
Renaissance Learning STAR reading
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Renaissance Learning STAR reading
UK/USA, Australien
Offentlig:
Privat:
Forskningsinstitution:
At følge fremskridt ift. nationale læringsmål samt at screene elever for, hvorvidt de er i
risikozonen for at opnå dårlige skoleresultater i fremtiden.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 2-9
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet: Labels
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 34
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 20 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Alzina, A. 2016,
Using Formative Assessments to Improve Student Learning Outcomes: A
Study of the Different Types of Formative Assessments Teachers Use to Drive Instruction
and Their Effects on Student Learning
(Doctoral dissertation). Illinois: Concordia Univer-
sity Chicago.
Bongle, K.A. 2018,
The Correlational Study of the STAR Reading Assessment When Com-
pared to the Fountas and Pinnell Benchmark Assessment System for Third Grade Stu-
dents
(Doctoral dissertation). Illinois: Concordia University Chicago.
Cawthorn, J.C. 2017,
The Analysis of the Relationship of Variables and the MKAS [superscript
2] Assessment
(Doctoral dissertation). Mississippi: Delta State University.
Foster, M.A. 2017,
The Effectiveness of High Frequency Word List Instruction on STAR Read-
ing Test Scores
(Doctoral dissertation). Virginia: Liberty University.
32
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Gregory, B. 2017,
The Effect of Guided Reading on Literacy Achievement of Third and Fourth
Grade Students
(Doctoral dissertation). Missouri: Missouri Baptist University.
Luo, T., Lee, G. & Molina, C. 2017, "Incorporating IStation into Early Childhood Classrooms to
Improve Reading Comprehension",
Journal of Information Technology Education: Re-
search,
vol. 16, pp. 247-266.
Minor, L. 2017,
Using Middle of the Year Diagnostic Reading Assessment Results to Predict
Third Grade Assessment Results
(Doctoral dissertation). Mississippi: Mississippi College.
Montanari, S. 2014, "A Case Study of Bi-Literacy Development among Children Enrolled in an
Italian-English Dual Language Program in Southern California",
International Journal of
Bilingual Education and Bilingualism,
vol. 17, no. 5, pp. 509-525.
Renaissance Learning, 2016,
STAR Reading™ Technical Manual,
London: Renaissance
Learning Inc.
Sampson, B. 2018,
TCAP Assessment in Correlation with and as Compared by STAR Assess-
ment
(Doctoral dissertation). Tennessee: East Tennessee State University.
Tillman, T.C. 2018,
Improving Reading Achievement at Greenleaf Upper Elementary School:
A Mixed Methods Study
(Doctoral dissertation). Mississippi: The University of Mississippi.
Wing, S. 2017,
A Study of the Effects of Metacognitive Instruction on Reading Comprehension
in the Primary Classroom
(Doctoral dissertation). Oregon: Concordia University-Portland.
33
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0034.png
Renaissance Learning STAR math
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Renaissance Learning STAR math
UK/USA
Offentlig:
Privat:
Forskningsinstitution:
At følge fremskridt ift. nationale læringsmål samt at screene elever for, hvorvidt de er i
risikozonen for at opnå dårlige skoleresultater i fremtiden.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 2-9
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet: Labels
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 24
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 20 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Alzina, A. 2016,
Using Formative Assessments to Improve Student Learning Outcomes: A
Study of the Different Types of Formative Assessments Teachers Use to Drive Instruction
and Their Effects on Student Learning
(Doctoral dissertation). Illinois: Concordia Univer-
sity Chicago.
Bongle, K.A. 2018,
The Correlational Study of the STAR Reading Assessment When Com-
pared to the Fountas and Pinnell Benchmark Assessment System for Third Grade Stu-
dents
(Doctoral dissertation). Illinois: Concordia University Chicago.
Cawthorn, J.C. 2017,
The Analysis of the Relationship of Variables and the MKAS [superscript
2] Assessment
(Doctoral dissertation). Mississippi: Delta State University.
Foster, M.A. 2017,
The Effectiveness of High Frequency Word List Instruction on STAR Read-
ing Test Scores
(Doctoral dissertation). Virginia: Liberty University.
34
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Gregory, B. 2017,
The Effect of Guided Reading on Literacy Achievement of Third and Fourth
Grade Students
(Doctoral dissertation). Missouri: Missouri Baptist University.
Luo, T., Lee, G. & Molina, C. 2017, "Incorporating IStation into Early Childhood Classrooms to
Improve Reading Comprehension",
Journal of Information Technology Education: Re-
search,
vol. 16, pp. 247-266.
Minor, L. 2017,
Using Middle of the Year Diagnostic Reading Assessment Results to Predict
Third Grade Assessment Results
(Doctoral dissertation). Mississippi: Mississippi College.
Montanari, S. 2014, "A Case Study of Bi-Literacy Development among Children Enrolled in an
Italian-English Dual Language Program in Southern California",
International Journal of
Bilingual Education and Bilingualism,
vol. 17, no. 5, pp. 509-525.
Renaissance Learning, 2016,
STAR Reading™ Technical Manual,
London: Renaissance
Learning Inc.
Sampson, B. 2018,
TCAP Assessment in Correlation with and as Compared by STAR Assess-
ment
(Doctoral dissertation). Tennessee: East Tennessee State University.
Tillman, T.C. 2018,
Improving Reading Achievement at Greenleaf Upper Elementary School:
A Mixed Methods Study
(Doctoral dissertation). Mississippi: The University of Mississippi.
Wing, S. 2017,
A Study of the Effects of Metacognitive Instruction on Reading Comprehension
in the Primary Classroom
(Doctoral dissertation). Oregon: Concordia University-Portland.
35
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0036.png
Dynamic Indicators of Basic Early Literacy Skills (DIBELS)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Dynamic Indicators of Basic Early Literacy Skills (DIBELS)
USA/International
Offentlig:
Privat:
Forskningsinstitution:
At træffe datadrevne vurderinger af kompetencer baseret på elevernes svartid samt at forbedre
elevens outcome.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Kindergarden – grade 8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Amendum, S.J., Conradi, K. & Pendleton, M.J. 2016, "Interpreting Reading Assessment Data:
Moving From Parts to Whole in a Testing Era",
Intervention in School and Clinic,
vol. 51,
no. 5, pp. 284-292.
Biancarosa, G., Bryk, A.S. & Dexter, E.R. 2010, "Assessing the Value-Added Effects of Literacy
Collaborative Professional Development on Student Learning",
Elementary School Jour-
nal,
vol. 111, no. 1, pp. 7-34.
Born, M. & Curtis, R. 2013, "(Re)Discovering Retrospective Miscue Analysis: An Action Re-
search Exploration Using Recorded Readings to Improve Third-Grade Students' Reading
Fluency",
i.e.: inquiry in education,
vol. 4, no. 2, pp. 1-14.
36
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Deeney, T.A. & Shim, M.K. 2016, "Teachers' and Students' Views of Reading Fluency: Issues
of Consequential Validity in Adopting One-Minute Reading Fluency Assessments",
As-
sessment for Effective Intervention,
vol. 41, no. 2, pp. 109-126.
Doty, S.J., Hixson, M.D., Decker, D.M., Reynolds, J.L. & Drevon, D.D. 2015, "Reliability and
Validity of Advanced Phonics Measures",
Journal of Psychoeducational Assessment,
vol.
33, no. 6, pp. 503-521.
Goffreda, C.T. & DiPerna, J.C. 2010, "An Empirical Review of Psychometric Evidence for the
Dynamic Indicators of Basic Early Literacy Skills",
School Psychology Review,
vol. 39, no.
3, pp. 463-483.
Han, J.N., Vanderwood, M.L. & Lee, C.Y. 2015, "Predictive Validity of Early Literacy Measures
for Korean English Language Learners in the United States",
International Journal of
School & Educational Psychology,
vol. 3, no. 3, pp. 178-188.
Haughbrook, R., Hart, S.A., Schatschneider, C. & Taylor, J. 2017, "Genetic and Environmental
Influences on Early Literacy Skills across School Grade Contexts",
Developmental Sci-
ence,
vol. 20, no. 5, pp. 1-12.
Kim, J.S., Vanderwood, M.L. & Lee, C.Y. 2016, "Predictive Validity of Curriculum-Based
Measures for English Learners at Varying English Proficiency Levels",
Educational As-
sessment,
vol. 21, no. 1, pp. 1-18.
Munger, K.A. & Murray, M.S. 2017, "First-Grade Spelling Scores within the Dynamic Indicators
of Basic Early Literacy Skills (DIBELS) Screening: An Exploratory Study",
Educational
Assessment,
vol. 22, no. 2, pp. 124-137.
Osowski, M.I. 2017,
The Predictability of New Mexico's Summative Reading Assessment by
Two Commonly Used Early Literacy Assessments, the Dynamic Indicators of Basic Early
Literacy Skills Next ("DIBELS Next") and the Developmental Reading Assessment-Sec-
ond Edition (DRA2)
(Doctoral dissertation). New Mexico: The University of New Mexico.
Petscher, Y., Kim, Y. & Foorman, B.R. 2011, "The Importance of Predictive Power in Early
Screening Assessments: Implications for Placement in the Response to Intervention
Framework",
Assessment for Effective Intervention,
vol. 36, no. 3, pp. 158-166.
Purvis, J.S. 2017,
The Relationship between Reading Fluency and Lexile Measures
(Doctoral
dissertation). Virginia: Liberty University.
Quirk, M., Schwanenflugel, P.J. & Webb, M. 2009, "A Short-Term Longitudinal Study of the
Relationship between Motivation to Read and Reading Fluency Skill in Second Grade",
Journal of Literacy Research,
vol. 41, no. 2, pp. 196-227.
Shapiro, E.S., Fritschmann, N.S., Thomas, L.B., Hughes, C.L. & McDougal, J. 2014, "Concur-
rent and Predictive Validity of Reading Retell as a Brief Measure of Reading Comprehen-
sion for Narrative Text",
Reading Psychology,
vol. 35, no. 7, pp. 644-665.
Shapiro, E.S., Hilt-Panahon, A., Gischlar, K.L., Semeniak, K., Leichman, E. & Bowles, S. 2012,
"An Analysis of Consistency between Team Decisions and Reading Assessment Data
within an RTI Model",
Remedial and Special Education,
vol. 33, no. 6, pp. 335-347.
Shelton, N.R., Altwerger, B. & Jordan, N. 2009, "Does DIBELS put reading first?",
Literacy
Research and Instruction,
vol. 48, no. 2, pp. 137-148.
37
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Smolkowski, K. & Cummings, K.D. 2016, "Evaluation of the DIBELS (Sixth Edition) Diagnostic
System for the Selection of Native and Proficient English Speakers at Risk of Reading
Difficulties",
Journal of Psychoeducational Assessment,
vol. 34, no. 2, pp. 103-118.
Toyama, Y., Hiebert, E.H. & Pearson, P.D. 2017, "An Analysis of the Text Complexity of Lev-
eled Passages in Four Popular Classroom Reading Assessments",
Educational Assess-
ment,
vol. 22, no. 3, pp. 139-170.
Young-Suk Kim, Petscher, Y., Schatschneider, C. & Foorman, B. 2010, "Does Growth Rate in
Oral Reading Fluency Matter in Predicting Reading Comprehension Achievement?",
Jour-
nal of Educational Psychology,
vol. 102, no. 3, pp. 652-667.
38
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0039.png
Nationale prøver (Sverige)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Nationale prøver
Sverige
Offentlig:
Privat:
Forskningsinstitution:
At støtte en lige og retfærdig vurdering samt klassificering af elevens kompetencer.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Svensk, matematik
Delskalaer:
Ja
Alder/klassetrin: Årskurs 3, 6 og 9
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Arbejder mod at digitalisere testen i 2022 (pt. 100 testskoler)
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Andersson, K. 2014,
Pojkar kan visst skriva! Skrivkompetenser på nationellt prov i svenska i
Sverige, Åbo:
Åbo Akademis förlag.
Arensmeier, C. & Lennqvist Lindén, A. 2017, "Bemyndigande eller granskning. Nationella prov
som styrinstrument",
Utbildning och Demokrati,
vol. 26, no. 2, pp. 49-74.
Boesen, J., Lithner, J. & Palm, T. 2018, "Assessing mathematical competencies: an analysis
of Swedish national mathematics tests",
Scandinavian Journal of Educational Research,
vol. 62, no. 2, pp. 109-124.
Chaves-Sousa, S., Santos, S., Viana, F.L., Vale, A.P., Cadime, I., Prieto, G. & Ribeiro, I. 2017,
"Development of a word reading test: Identifying students at-risk for reading problems",
Learning & Individual Differences,
vol. 56, pp. 159-166.
39
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Gustafsson, J., Cliffordson, C. & Erickson, G. 2014,
Likvärdig kunskapsbedömning i och av
den svenska skolan: problem och möjligheter. Stockholm:
SNS förlag.
Gustafsson, J. & Erickson, G. 2018, "Nationella prov i Sverige – tradition, utmaning, förändring:
Temanummer om prøver i skolen: Nasjonale prøver og eksamener i norsk og svensk
grunnopplæring",
Acta Didactica Norge,
vol. 12, no. 4, pp. 1-20.
Hagberg-Persson, B., Berg, E. & Lagrell, K. 2010,
Ämnesprov i svenska och svenska som
andraspråk för årskurs 3: en utprövningsomgång. Svenska i utveckling nr. 28.
Uppsala:
Uppsala Universitet.
Jungert, T. & Andersson, U. 2013, "Self-efficacy Beliefs in Mathematics, Native Language Lit-
eracy and Foreign Language Amongst Boys and Girls with and without Mathematic Diffi-
culties",
Scandinavian Journal of Educational Research,
vol. 57, no. 1, pp. 1-15.
Knekta, E. 2017,
Motivational aspects of test-taking: measuring test-taking motivation in Swe-
dish national test contexts
(Doctoral dissertation). Umeå: Umeå Universitet.
Korhonen, J., Nyroos, M., Jonsson, B. & Eklöf, H. 2018, "Additive and multiplicative effects of
working memory and test anxiety on mathematics performance in grade 3 students",
Ed-
ucational Psychology,
vol. 38, no. 5, pp. 572-595.
Levlin, M. 2014,
Lässvårigheter, språklig förmåga och skolresultat i tidiga skolår: en undersök-
ning av 44 elever i årskurs 2 till 3
(Doctoral dissertation). Umeå: Umeå Universitet.
Lind Pantzare, A. 2018,
Dimensions of validity studies of the Swedish national tests in mathe-
matics
(Doctoral dissertation) Umeå: Umeå Universitet.
Lundahl, C. 2009,
Varför nationella prov? Framväxt, dilemman, möjligheter,
Lund: Studentlit-
teratur.
Lundahl, C., Wetterstrand, F. & Sundhäll, M. 2017, "Att få sina bedömningar granskade. Lära-
res syn på de nationella provens syfte att främja likvärdig bedömning",
Utbildning och
Demokrati,
vol. 26, no. 2, pp. 75-94.
Mark, M. & Palmér, A. 2017,
En utvecklande tolkningsgemenskap? Matrisanvändning, interak-
tion och kontext i bedömningssamtal om ett nationellt prov i muntlig framställning. Sven-
ska i utveckling nr. 34.
Uppsala: Uppsala universitet.
Mellroth, E. 2014,
High achiever! Always a high achiever? A comparison of student achieve-
ments on mathematical tests with different aims and goals
(Doctoral dissertation). Karls-
tad: Karlstads Universitet.
Nordlander, E. & Cortas Nordlander, M. 2013, "The noble art of problem solving: a critical view
on a Swedish national test" in
Technology Teachers as Researchers: Philosophical and
Empirical Technology,
eds. I. Skogh & M.J. De Vries, Sense Publishers, Rotterdam, pp.
101-117.
Nyroos, M. & Wiklund-Hornqvist, C. 2012, "The association between working memory and ed-
ucational attainment as measured in different mathematical subtopics in the Swedish na-
tional assessment: primary education",
Educational Psychology,
vol. 32, no. 2, pp. 239-
256.
Nyström, P. 2016,
Hur samstämmiga är svenska styrdokument och nationella prov med ram-
verk och uppgifter i TIMSS Advanced 2015?
Stockholm: Skolverket.
40
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0041.png
Nyström, P. 2009,
Hur samstämmiga är svenska styrdokument och nationella prov med ram-
verk och uppgifter i TIMSS Advanced 2008.
Stockholm: Skolverket.
Regeringskansliet, 2016,
Likvärdigt, rättssäkert och effektivt: ett nytt nationellt system för
kunskapsbedömning. Betänkande av Utredningen om nationella prov.
Stockholm: Sta-
tens Offentliga Utredningar.
Skolinspektionen, 2017,
Bedömningsprocessernas betydelse för likvärdigheten – Ombedöm-
ning av nationella prov 2016.
Stockholm: Skolinspektionen.
Skolinspektionen, 2010,
Kontrollrättning av nationella prov i grundskolan och gymnasieskolan.
Stockholm: Skolinspektionen.
Skolverket, 2019,
Analyser av likvärdig betygssättning mellan elevgrupper och sko-
lor. Jämförelser mellan betyg och nationella prov i årskurs 9.
Stockholm: Skolverket.
Skolverket, 2019,
Nationella prov.
Tilgængelig på: https://www.skolverket.se/a-o/landningssi-
dor-a-o/nationella-prov. Besøgt d. 18-09-2019.
41
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0042.png
Nationale prøver (Norge)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Nationale prøver
Norge
Offentlig:
Privat:
Forskningsinstitution:
At danne et grundlag for en vurdering af undervisningen samt at udvikle/forbedre kvaliteten på
alle niveauer i skolesystemet.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning, matematik
Delskalaer:
Ja
Alder/klassetrin: 5., 8. og 9. trinn
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 90 min. (for hver test)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Andersson, K. 2014,
Pojkar kan visst skriva! Skrivkompetenser på nationellt prov i svenska i
Sverige.
Åbo: Åbo Akademis förlag.
Arntzen, R., Kvifte, B.H. & Hjelde, A. 2017, "Andrespråkselevers møte med obligatoriske lese-
prøver fra småskole- til mellomtrinn",
NOA: norsk som andrespråk,
vol. 33, no. 1, pp. 33-
62.
Bjørnsson, J.K. 2018,
Metodegrunnlag for nasjonale prøver.
Oslo: Utdanningsdirektoratet.
Björnsson, J.K. 2018, "Om lenkefeil og ekvivaleringsmetoder på nasjonale prøver: Evaluering
av endring over tid",
Acta Didactica Norge,
vol. 12, no. 4, pp. 1-24.
42
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0043.png
Blömeke, S. & Olsen, R.V. 2018, "På vei mot et sammenhengende nasjonalt kvalitetsvurde-
ringssystem",
Acta Didactica Norge,
vol. 12, no. 4, pp. 21-21.
Evensen, L.S., Berge, K.L., Thygesen, R., Matre, S. & Solheim, R. 2016, "Standards as a Tool
for Teaching and Assessing Cross-Curricular Writing",
Curriculum Journal,
vol. 27, no. 2,
pp. 229-245.
Fauskevåg, O. 2016, "Nasjonale prøver i lesing - eit godt mål på leseferdigheit?",
Tidsskriftet
FoU i praksis,
vol. 10, no. 1, pp. 7-21.
Monsen, M. 2014,
Store forventninger? Læreroppfatninger om eksterne leseprøver
(Doctoral
dissertation). Oslo: Universitetet i Oslo.
Nordahl, I.S. 2018,
Nasjonale prøver og TIMSS som læreplan? En komparativ og temasentrert
studie av LK06, TIMSS og nasjonale prøver
(Doctoral dissertation). Alta: UiT Norges ark-
tiske universitet.
Roe, A. 2010, "Nasjonale leseprøver - hva de måler og hvordan resultatene kan brukes",
Bedre
skole,
no. 1, pp. 41-47.
Roe, A. & Vagle, W. 2012, "Kjønnsforskjeller i lesing – et dybdedykk i resultatene fra nasjonale
prøver på åttende trinn fra 2007 til 2011",
Norsk pedagogisk tidsskrift,
no. 6, pp. 425-441.
Skar, G.B.U. & Aasen, A.J. 2018, "Å måle skriving som grunnleggende ferdighet",
Acta Didac-
tica Norge,
vol. 12, no. 4, pp. 1-29.
Utdanningsdirektoratet, 2018,
Hva måler nasjonale prøver i lesing?.
Tilgængelig på:
https://www.udir.no/eksamen-og-prover/prover/nasjonale-prover/mestringsbeskrivelser-
og-hva-provene-maler/kva-maler-lesing/. Besøgt d. 18-09-2019.
Utdanningsdirektoratet, 2017,
Hva måler nasjonal prøve i regning?.
Tilgængelig på:
https://www.udir.no/eksamen-og-prover/prover/nasjonale-prover/mestringsbeskrivelser-
og-hva-provene-maler/hva-maler-nasjonal-prove-i-regning/. Besøgt d. 18-09-2019.
Utdanningsdirektoratet,
Nasjonale prøver.
Tilgængelig på: https://www.udir.no/eksamen-og-
prover/prover/nasjonale-prover/. Besøgt d. 18-09-2019.
43
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0044.png
National Assessment of Educational Progress (NAEP)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
National Assessment of Educational Progress (NAEP)
USA
Offentlig:
Privat:
Forskningsinstitution:
At informere om de uddannelsesmæssige forbedringer, der sker på tværs af landet, inden for
stater, distrikter samt inden for forskellige elevgrupper.
Pædagogisk værktøj:
Styringsredskab:
Screeningsværktøj:
Andet: Overvågning af uddannelsesmæssige fremskridt inden for geografisk område.
Målgruppe:
Emne:
Population: Stikprøve af elever på tværs af
landet
Fag: Matematik, læsning, skrivning
Delskalaer:
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet: Forskere
Karaktergivning:
Kriteriebaseret:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 90-120 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Ja
Nej
Alder/klassetrin: Grade 4, 8 og 12
Andet: Resultaterne er rapporteret for grupper af elever med lignende karakteristika fx køn, race,
etnicitet o.l.
Visualisering:
Online:
Andet:
Note:
På papir:
Litteratur
Congressional Research Service, 2018,
National and International Educational Assessments:
Overview, Results, and Issues. CRS Report R45401, Version 3. Updated,
District of Co-
lumbia: Congressional Research Service.
Foreman-Murray, L. & Fuchs, L.S. 2019, "Quality of explanation as an indicator of fraction
magnitude understanding",
Journal of Learning Disabilities,
vol. 52, no. 2, pp. 181-191.
Foundation for Excellence in Education, & RMC Research, 2017,
North Carolina Read to
Achieve: An Inside Look.
Florida: Foundation for Excellence in Education.
Kloosterman, P. 2011, "Mathematics Skills of Nine-Year-Olds: 1978 to 2004",
Elementary
School Journal,
vol. 112, no. 1, pp. 183-203.
44
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0045.png
Loveless, T. 2016, “How
Well Are American Students Learning? With Sections on Reading and
Math in the Common Core Era, Tracking and Advanced Placement (AP), and Principals
as Instructional Leaders.
The 2016 Brown Center Report on American Education. Vol. 3,
No. 5. District of Columbia: Brookings Institution.
Morgan, L.L. 2016,
An examination of the relationship between state educational accountability
policy and national student reading achievement
(Doctoral dissertation). Californien:
Northcentral University.
National Center for Education Statistics,
National Assessment of Educational Progress.
Tilgængelig på: https://nces.ed.gov/nationsreportcard/. Besøgt d. 18-10-2019.
National Center for Education Statistics,
National Assessment of Educational Progress. Tech-
nical Documentation on the Web.
Tilgængelig på:
https://nces.ed.gov/nationsreport-
card/tdw/
. Besøgt d. 18-10-2019.
Polat, N., Zarecky-Hodge, A. & Schreiber, J.B. 2016, "Academic Growth Trajectories of ELLs
in NAEP Data: The Case of Fourth- and Eighth-Grade ELLs and Non-ELLs on Mathemat-
ics and Reading Tests",
Journal of Educational Research,
vol. 109, no. 5, pp. 541-553.
Tallman, M., Carter, T. & Kansas Association of, S.B. 2015,
Kansas Educational Achievement
Report Card 2015. Research Reports.
Kansas: Kansas Association of School Boards.
White, S., Kim, Y.Y., Chen, J., Liu, F. & National Center for, E.S. 2015,
Performance of Fourth-
Grade Students in the 2012 NAEP Computer-Based Writing Pilot Assessment: Scores,
Text Length, and Use of Editing Tools. Working Paper Series. NCES 2015-119,
District
of Columbia: National Center for Education Statistics.
Wixson, K.K., Raphael, T.E., Au, K.H. & International Literacy Association. 2018,
Exploring the
2017 NAEP Reading Results: Systemic Reforms Beat Simplistic Solutions. Literacy Lead-
ership Brief.
Delaware: International Literacy Association.
Yun, J. 2017,
Investigating Structures of Reading Comprehension Attributes at Different Profi-
ciency Levels: Applying Cognitive Diagnosis Models and Factor Analyses
(Doctoral dis-
sertation). Florida: Florida State University.
45
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0046.png
National Assessment (Australien)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
National Assessment
Australien
Offentlig:
Privat:
Forskningsinstitution:
At hjælpe regeringen til at sammenligne elevernes resultater med internationale resultater og
derudover til at identificere områder med behov for forbedringer.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning, skrivning, grammatik, matematik
Delskalaer:
Ja
Alder/klassetrin: Years 3, 5, 7 og 9
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
ACARA - Australian Curriculum Assesment and Reporting Authority, 2018,
Naplan 2018.
Technical report.
Sydney: ACARA - Australian Curriculum Assesment and Reporting Au-
thority.
Brinkman, S., Gregory, T., Harris, J., Hart, B., Blackmore, S. & Janus, M. 2013, "Associations
between the Early Development Instrument at Age 5, and Reading and Numeracy Skills
at Ages 8, 10 and 12: a Prospective Linked Data Study",
Child Indicators Research,
vol.
6, no. 4, pp. 695-708.
Daffern, T., Mackenzie, N.M. & Hemmings, B. 2017, "Predictors of writing success: How im-
portant are spelling, grammar and punctuation?"
Australian Journal of Education,
vol. 61,
no. 1, pp. 75-87.
46
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0047.png
Mundy, L.K., Canterford, L., Tucker, D., Bayer, J., Romaniuk, H., Sawyer, S., Lietz, P., Red-
mond, G., Proimos, J., Allen, N. & Patton, G. 2017, "Academic Performance in Primary
School Children With Common Emotional and Behavioral Problems",
Journal of School
Health,
vol. 87, no. 8, pp. 593-601.
National Assesment Program,
Naplan.
Tilgængelig på: https://www.nap.edu.au/home. Besøgt
d. 18-09-2019.
Ragusa, A.T. & Bousfield, K. 2017, "‘It’s not the test, it’s how it’s used!’ Critical analysis of public
response to NAPLAN and MySchool Senate Inquiry",
British Journal of Sociology of Edu-
cation,
vol. 38, no. 3, pp. 265-286.
47
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0048.png
National Foundation for Educational Research (NFER) Tests
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
National Foundation for Educational Research (NFER) Tests
UK
Offentlig:
Privat:
Forskningsinstitution:
At følge præstationer og udvikling på både individuelt niveau og gruppeniveau.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Alder/klassetrin: Years 1-6
Fag: Læsning, retskrivning, grammatik, matematik
Delskalaer:
Ja
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: ?
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Andet: Den skalerede skala er en rå score
Visualisering:
Online:
Andet:
Note:
På papir:
Litteratur
NFER – National Foundation for Educational Research, 2018,
Technical Information for
NFER Assessments in Reading and Mathematics Year 1 (Summer).
Berkshire: NFER –
national Foundation for Educational Research.
NFER - National Foundation for Educational Research, 2019,
NFER Tests for years 1-6.
Berk-
shire: National Foundation for Educational Research.
Kelly, P., Andreasen, K.E., Kousholt, K., McNess, E. & Ydesen, C. 2018, "Education govern-
ance and standardised tests in Denmark and England",
Journal of Education Policy,
vol.
33, no. 6, pp. 739-758.
48
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0049.png
Canadian Achievement Test (CAT4)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Canadian Achievement Test (CAT4)
Canada
Offentlig:
Privat:
Forskningsinstitution:
At kunne sammenligne pensum og effektivitet på tværs af distrikter, og at forældrene
efterfølgende kan anvende resultaterne som sammenligningsgrundlag.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning, skrivning. matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 1-12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
CAT5 er den nyeste version af testen, CAT4 er dog stadig aktuel.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: ?
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Canadian Test Centre, Educational Assessment Services, (n.d.),
Technical Manual. Ontario:
Canadian Test Centre, Educational Assessment Services.
Cat5,
About Cat5.
Tilgængelig på: https://www.canadiantestcentre.com/cat5/index.php.
Besøgt d. 18-09-2019.
Meyer, E., Abrami, P.C., Wade, C.A., Aslan, O. & Deault, L. 2010, "Improving Literacy and
Metacognition with Electronic Portfolios: Teaching and Learning with ePEARL",
Comput-
ers & Education,
vol. 55, no. 1, pp. 84-91.
Stornelli, D., Flett, G.L. & Hewitt, P.L. 2009, "Perfectionism, Achievement, and Affect in Chil-
dren: A Comparison of Students from Gifted, Arts, and Regular Programs",
Canadian
Journal of School Psychology,
vol. 24, no. 4, pp. 267-283.
49
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0050.png
Programme for International Student Assessment (PISA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Programme for International Student Assessment (PISA)
International
Offentlig:
Privat:
Forskningsinstitution:
At foretage en global evaluering af landes uddannelsessystemer, der kan følge trends inden for
elevers viden og evner i hele verden.
Pædagogisk værktøj:
Styringsredskab:
Screeningsværktøj:
Andet: Kan potentielt bruges som styringsredskab for de involverede lande
Målgruppe:
Emne:
Population: National repræsentativ stikprøve af
15-årige skolebørn
Fag: Læsning, matematik
Delskalaer:
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Udføres hvert tredje år
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: To timer
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Ja
Nej
Alder/klassetrin: 15-årige
Litteratur
Andreasen, K. 2015,
Test og prøvelser: oprindelse, udvikling, aktualitet.
Aalborg: Aalborg Uni-
versitetsforlag.
Arnesson, D., Lundahl, L., Rönnberg, L. & Arnqvist, A. 2016,
PISA i skolan: hur lärare, rektorer
och skolchefer förhåller sig till internationella kunskapsmätningar.
Umeå: Institutionen för
tillämpad utbildningsvetenskap, Umeå universitet.
Arya, D.J., McClung, N.A., Katznelson, N. & Scott, L. 2016, "Language Ideologies and Literacy
Achievement: Six Multilingual Countries and Two International Assessments",
Interna-
tional Journal of Multilingualism,
vol. 13, no. 1, pp. 40-60.
Damvad Analytics 2014,
PISA-relatering af de kriteriebaserede nationale test: Delrapport - for-
midling af resultater.
København: Damvad Analytics.
50
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0051.png
DPU 2019, 30. jan.,
Internationale undersøgelser.
Tilgængelig på: http://edu.au.dk/forsk-
ning/internationaleundersoegelser/. Besøgt d. 18-09-2019.
Elstad, E. & Sivesind, K. 2010,
PISA: sannheten om skolen?
Oslo: Universitetsforlaget.
Fauskevåg, O. 2016, "Lesing som anerkjennelse: den manglende dimensjonen i PISAs begrep
om leseferdighet",
Studier i pædagogisk filosofi,
vol. 5, no. 1., pp. 18-39.
Henningsen, I. & Allerup, P. 2017,
Pisa - matematik: holdninger og fakta.
Samsø: Matematik.
Jerrim, J. & Choi, A. 2014, "The mathematics skills of school children: how does England com-
pare to the high-performing East Asian jurisdictions?",
Journal of Education Policy,
vol.
29, no. 3, pp. 349-376.
Kiss, D. 2013, "Are Immigrants and Girls Graded Worse? Results of a Matching Approach",
Education Economics,
vol. 21, no. 5, pp. 447-463.
Lai, M.K., McNaughton, S., Arnituanai-Toloa, M., Turner, R. & Hsiao, S. 2009, "Sustained Ac-
celeration of Achievement in Reading Comprehension: The New Zealand Experience",
Reading Research Quarterly,
vol. 44, no. 1, pp. 30-56.
Laukaitytė, I. 2016,
Statistical modeling in international large-scale assessments.
Umeå: De-
partment of Statistics, Umeå School of Business and Economics, Umeå universitet.
Lauritsen, H. & Dolin, J. 2010, "Danske elever kunne have klaret sig bedre i Pisa",
Undervi-
sere.dk,
vol. 4, pp. 6-8.
Lockheed, M., Prokic-Bruer, T., & Shadova, A. 2015,
The Experience of Middle-Income Coun-
tries Participating in PISA 2000-2015.,
District of Columbia & Paris: The World Bank &
OECD Publishing.
OECD, 2017,
PISA 2015. Technical Report.
Paris: OECD Publishing.
OECD, 2019,
What is PISA?
Tilgængelig på: http://www.oecd.org/pisa/aboutpisa/ . Besøgt d.
18-09-2019.
OECDiLibrary 2019,
PISA publications.
Tilgængelig på: https://www.oecd-ilibrary.org/educa-
tion/pisa_19963777. Besøgt d. 18-09-2019.
Pagaard, D.M. 2011, "PISA - hvem, hvad, hvor, men ikke mindst hvorfor",
Geografisk Oriente-
ring,
vol. 41, no. 3, pp. 106-108.
Schwabe, F., McElvany, N. & Trendtel, M. 2015, "The School Age Gender Gap in Reading
Achievement: Examining the Influences of Item Format and Intrinsic Reading Motivation",
Reading Research Quarterly,
vol. 50, no. 2, pp. 219-232.
Skinner, R.R. 2018,
National and International Educational Assessments: Overview, Results,
and Issues. CRS Report R45401, Version 3. Updated.
District of Columbia: Congressional
Research Service.
Skolverket, 2016,
PISA 2015: 15-åringars kunskaper i naturvetenskap, läsförståelse och ma-
tematik.
Stockholm: Skolverket.
Skolverket, 2015,
Med fokus på matematik: analys av samstämmighet mellan svenska styrdo-
kument och den internationella studien PISA 2012.
Stockholm: Skolverket.
51
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0052.png
Skolverket, 2015,
To respond or not to respond: the motivation of Swedish students in taking
the PISA test.
Stockholm: Skolverket.
Skolverket, 2013,
PISA 2012: 15-åringars kunskaper i matematik, läsförståelse och naturve-
tenskap.
Stockholm: Skolverket.
Søby Madsen, K. 2011, "PISA-undersøgelser", Tilgængelig på: https://faktalink.dk/titelli-
ste/pisa-undersoegelserne. Besøgt d. 18-09-2019.
Sollerman, S. 2019,
Kan man räkna med PISA och TIMSS? Relevansen hos internationella
storskaliga mätningar i matematik i en nationell kontext.
Stockholm: Institutionen för ma-
tematikämnets och naturvetenskapsämnenas didaktik, Stockholms universitet.
52
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0053.png
Trends in International Mathematics and Science Study (TIMMS)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Trends in International Mathematics and Science Study (TIMSS)
International
Offentlig:
Privat:
Forskningsinstitution:
At sammenligne uddannelsessystemer globalt samt at følge globale trends inden for elevers
matematiske færdigheder.
Pædagogisk værktøj:
Styringsredskab:
Screeningsværktøj:
Andet: Kan potentielt bruges som styringsredskab for de involverede lande
Målgruppe:
Emne:
Population: National repræsentativ stikprøve af
elever i 4. og 8. klasse.
Fag: Matematik
Delskalaer:
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Udføres hver fjerde år
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 124-220 afhængig af område og
klassetrin
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: To timer
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Ja
Nej
Alder/klassetrin: 4. og 8. klasse
Litteratur
Andreasen, K. 2015,
Test og prøvelser: oprindelse, udvikling, aktualitet,
Aalborg: Aalborg Uni-
versitetsforlag.
Arnesson, D., Lundahl, L., Rönnberg, L. & Arnqvist, A. 2016,
PISA i skolan: hur lärare, rektorer
och skolchefer förhåller sig till internationella kunskapsmätningar,
Umeå: Institutionen för
tillämpad utbildningsvetenskap, Umeå universitet.
Grønmo, L.S. & Onstad, T. 2013,
The significance of TIMSS and TIMSS advanced: mathemat-
ics education in Norway, Slovenia and Sweden.
Oslo: Akademia Publishing.
Grønmo, L.S. & Onstad, T. (eds) 2014,
Opptur og nedtur. Analyser av TIMSS-data for Norge
og Sverige.
Oslo: Akademika Publishing.
53
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0054.png
Jerrim, J. & Choi, A. 2014, "The mathematics skills of school children: how does England com-
pare to the high-performing East Asian jurisdictions?",
Journal of Education Policy,
vol.
29, no. 3, pp. 349-376.
Laukaitytė, I. 2016,
Statistical modeling in international large-scale assessments.
Umeå: De-
partment of Statistics, Umeå School of Business and Economics, Umeå universitet.
Loveless, T. & Brookings Institution, Brown Center on Education Policy, 2016,
How Well Are
American Students Learning? With Sections on Reading and Math in the Common Core
Era, Tracking and Advanced Placement (AP), and Principals as Instructional Leaders.
The 2016 Brown Center Report on American Education. Volume 3, Number 5.
District of
Columbia: Brookings Institution.
Martin, M. O., Mullis, I. V., & Hooper, M. 2016,
Methods and procedures in TIMSS
2015.
Massachusetts: TIMSS & PIRLS International Study Center, Lynch School of Edu-
cation, Boston College and International Association for the Evaluation of Educational
Achievement (IEA).
Mullis, I.V.S. & Martin, M.O. (eds) 2017,
TIMSS 2019 Assessment Frameworks,
Massachu-
setts: TIMSS & PIRLS International Study Center, Lynch School of Education, Boston
College and International Association for the Evaluation of Educational Achievement
(IEA).
Mullis, I.V.S. & Martin, M.O. 2016, "Dependable Trend Measurement Is Not Just IRT Scaling:
Commentary on "Linking Large-Scale Reading Assessments: Measuring International
Trends over 40 Years"",
Measurement: Interdisciplinary Research and Perspectives,
vol.
14, no. 1, pp. 30-31.
Nordahl, I.S. 2018,
Nasjonale prøver og TIMSS som læreplan? En komparativ og temasentrert
studie av LK06, TIMSS og nasjonale prøver.
Alta: UiT Norges arktiske universitet.
Nyström, P. 2016,
Hur samstämmiga är svenska styrdokument och nationella prov med ram-
verk och uppgifter i TIMSS Advanced 2015?
Stockholm: Skolverket.
Nyström, P. 2009,
Hur samstämmiga är svenska styrdokument och nationella prov med ram-
verk och uppgifter i TIMSS Advanced 2008 [Elektronisk resurs].
Stockholm: Skolverket.
Skinner, R.R. 2018,
National and International Educational Assessments: Overview, Results,
and Issues. CRS Report R45401, Version 3. Updated.
District of Columbia: Congressional
Research Service.
Skolverket 2016,
TIMSS 2015: svenska grundskoleelevers kunskaper i matematik och natur-
vetenskap i ett internationellt perspektiv (Rapport 448).
Stockholm: Skolverket.
Sollerman, S. 2019,
Kan man räkna med PISA och TIMSS? Relevansen hos internationella
storskaliga mätningar i matematik i en nationell kontext.
Stockholm: Institutionen för ma-
tematikämnets och naturvetenskapsämnenas didaktik, Stockholms universitet.
TIMSS & PIRLS International Study Center
Data to improve education world wide.
Tilgængelig
på: https://timssandpirls.bc.edu/. Besøgt d. 18-09-2019.
Unlu, A. & Schurig, M. 2015, "Computational Typologies of Multidimensional End-of-Primary-
School Performance Profiles from an Educational Perspective of Large-Scale TIMSS and
PIRLS Surveys",
Current Issues in Comparative Education,
vol. 18, no. 1, pp. 6-25.
Wiberg, M. & Rolfsman, E. 2010,
School-effectiveness in mathematics in Sweden compared
with countries in Europe and Asia-Pacific (The 4th IEA International Research Confer-
ence, Gothenburg, Sweden, 1–3 July 2010.,
Umeå: Umeå University, Faculty of Social
Sciences, Department of Applied Educational Science.
54
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0055.png
Progress in International Reading Literacy Study - PIRLS
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Progress in International Reading Literacy Study (PIRLS)
International
Offentlig:
Privat:
Forskningsinstitution:
At sammenligne elevers læseevner inden for og på tværs af landegrænser.
Pædagogisk værktøj:
Styringsredskab:
Screeningsværktøj:
Andet: Kan potentielt bruges som styringsredskab for de involverede lande.
Målgruppe:
Emne:
Population: Alle elever i en klasse på udvalgte
skoler (national repræsentativ stikprøve)
Fag: Læsning
Delskalaer:
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Udføres hvert femte år
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Ja
Nej
Alder/klassetrin: 4. klasse
Litteratur
Arnesson, D., Lundahl, L., Rönnberg, L. & Arnqvist, A. 2016,
PISA i skolan: hur lärare, rektorer
och skolchefer förhåller sig till internationella kunskapsmätningar.
Umeå: Institutionen för
tillämpad utbildningsvetenskap, Umeå universitet.
Arya, D.J., McClung, N.A., Katznelson, N. & Scott, L. 2016, "Language Ideologies and Literacy
Achievement: Six Multilingual Countries and Two International Assessments",
Interna-
tional Journal of Multilingualism,
vol. 13, no. 1, pp. 40-60.
Caro, D.H., Kyriakides, L. & Televantou, I. 2018, "Addressing Omitted Prior Achievement Bias
in International Assessments: An Applied Example Using PIRLS-NPD Matched Data",
Assessment in Education: Principles, Policy & Practice,
vol. 25, no. 1, pp. 5-27.
DPU 2019,
Internationale undersøgelser.
Tilgængelig på: http://edu.au.dk/forskning/internatio-
naleundersoegelser/. Besøgt d. 18-09-2019.
55
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0056.png
Finch, W.H., Hernández Finch, M.E. & French, B.F. 2016, "Recursive Partitioning to Identify
Potential Causes of Differential Item Functioning in Cross-National Data",
International
Journal of Testing,
vol. 16, no. 1, pp. 21-53.
Hanushek, E.A. 2016, "Linking large-scale reading assessments: Comment",
Measurement:
Interdisciplinary Research and Perspectives,
vol. 14, no. 1, pp. 27-29.
Hao, S. & Johnson, R.L. 2013, "Teachers' Classroom Assessment Practices and Fourth-Grad-
ers' Reading Literacy Achievements: An International Study",
Teaching and Teacher Ed-
ucation: An International Journal of Research and Studies,
vol. 29, pp. 53-63.
Johansson, S., Myrberg, E. & Rosén, M. 2012, "Teachers and tests: Assessing pupils' reading
achievement in primary schools",
Educational Research and Evaluation,
vol. 18, no. 8,
pp. 693-711.
Martin, M.O., Mullis, I. V., & Hooper, M. 2017,
Methods and Procedures in PIRLS 2016.
Mas-
sachusetts:
Boston College, Lynch School of Education: TIMSS & PIRLS, International
Study Center.
Mullis, I.V.S., Martin, M.O. 2015,
PIRLS 2016 Assessment Framework
Massachusetts: Boston
College, TIMSS & PIRLS International Study Center & International Association for the
Evaluation of Educational Achievement.
Mullis, I.V.S., Martin, M.O., Kennedy, A.M., Trong, K.L., Sainsbury, M. & International Associ-
ation for the Evaluation of Educational Achievement, 2009,
PIRLS 2011 Assessment
Framework.
Amsterdam: International Association for the Evaluation of Educational
Achievement.
Schwabe, F., McElvany, N. & Trendtel, M. 2015, "The School Age Gender Gap in Reading
Achievement: Examining the Influences of Item Format and Intrinsic Reading Motivation",
Reading Research Quarterly,
vol. 50, no. 2, pp. 219-232.
Skinner, R.R. 2018,
National and International Educational Assessments: Overview, Results,
and Issues. CRS Report R45401, Version 3. Updated.
District of Columbia: Congressional
Research Service.
Sparfeldt, J.R., Kimmel, R., Lowenkamp, L., Steingraber, A. & Rost, D.H. 2012, "Not Read, but
Nevertheless Solved? Three Experiments on PIRLS Multiple Choice Reading Compre-
hension Test Items",
Educational Assessment,
vol. 17, no. 4, pp. 214-232.
Strietholt, R. & Rosén, M. 2016, "Linking Large-Scale Reading Assessments: Measuring Inter-
national Trends over 40 Years",
Measurement: Interdisciplinary Research and Perspec-
tives,
vol. 14, no. 1, pp. 1-26.
Thomson, S. & Australian Council for, E.R. 2018,
Enjoyment of Reading. Snapshots. Volume
11, Issue 11, Article 1.
Victoria: Australian Council for Educational Research.
TIMSS & PIRLS International Study Center,
Data to improve education world wide.
Tilgængelig
på: https://timssandpirls.bc.edu/. Besøgt d. 18-09-2019.
Unlu, A. & Schurig, M. 2015, "Computational Typologies of Multidimensional End-of-Primary-
School Performance Profiles from an Educational Perspective of Large-Scale TIMSS and
PIRLS Surveys",
Current Issues in Comparative Education,
vol. 18, no. 1, pp. 6-25.
56
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Warner-Griffin, C., Liu, H., Tadler, C., Herget, D., Dalton, B., National Center for, E.S. & Inter-
national, R. 2017,
Reading Achievement of U.S. Fourth-Grade Students in an Interna-
tional Context: First Look at the Progress in International Reading Literacy Study (PIRLS)
2016 and ePIRLS 2016. NCES 2018-017.
District of Columbia: National Center for Edu-
cation Statistics.
Yun, J. 2017,
Investigating Structures of Reading Comprehension Attributes at Different Profi-
ciency Levels: Applying Cognitive Diagnosis Models and Factor Analyses
(Doctoral dis-
sertation). Florida: Florida State University.
57
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0058.png
Tennessee Comprehensive Assessment Program (TCAP)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Tennessee Comprehensive Assessment Program (TCAP)
USA/Tennessee
Offentlig:
Privat:
Forskningsinstitution:
At følge elevens kompetencer og måle, hvorvidt de lever op til statens standarder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Matematik, English Language Arts (ELA)
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 230 min. (eng) og 2x145 min.
(mat)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Bivens, J. 2009,
The relationship between selected Tennessee elementary and middle school
library media centers and Tennessee Comprehensive Assessment Program Composite
Reading Test Scores
(Doctoral dissertation). Tennessee: Tennessee State University.
McLean, T. 2012, "A closer look at writing in the third grade" in , eds. A. Cyprès & J. Breckner,
IAP Information Age Publishing, Charlotte, NC, pp. 173-188.
Miller, K.C., Bell, S.M. & McCallum, R.S. 2015, "Using Reading Rate and Comprehension CBM
to Predict High-Stakes Achievement",
Journal of Psychoeducational Assessment,
vol. 33,
no. 8, pp. 707-718.
Myers, B.G. 2016,
Investigating the Effects of the Academy of Reading Program on Middle
School Reading Achievement
(Doctoral dissertation). Tennessee: Tennessee State Uni-
versity.
Sampson, B. 2018,
TCAP Assessment in Correlation with and as Compared by STAR Assess-
ment
(Doctoral dissertation). Tennessee: East Tennessee State University.
58
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0059.png
Montana Comprehensive Assessment System
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Montana Comprehensive Assessment System
USA/Montana
Offentlig:
Privat:
Forskningsinstitution:
At følge elevens kompetencer og måle, hvorvidt de lever op til nationale (statens) læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Matematik, engelsk
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8 og 10
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 78 MC, 3 CR (kun læseprøven)
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 3 x 55 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Atkins, T.L. & Cummings, K.D. 2011, "Utility of Oral Reading and Retell Fluency in Predicting
Proficiency on the Montana Comprehensive Assessment System",
Rural Special Educa-
tion Quarterly,
vol. 30, no. 2, pp. 3-12.
59
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0060.png
Oregon Assessment of Knowledge and Skills
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Oregon Assessment of Knowledge and Skills
USA/Oregon
Offentlig:
Privat:
Forskningsinstitution:
At følge elevens kompetencer og måle, hvorvidt de lever op til nationale læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Folkeskoleelever
Fag: English Language Arts (ELA), matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8 og 11
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Oregon Department of Education, n.d.,
2009-2010, Technical Report. Oregon’s Statewide
Assessment System. Annual Report, vol. 1.
Salem: Oregon Department of Education.
Nakamoto, J., Sobolew-Shubin, S., Orland, M. & WestEd 2015,
The Beaverton School District
Arts for Learning (A4L) Lessons Project, an Investing in Innovation (i3) Development
Grant: Student Impact Findings from Years 1, 2, and 3.
California: WestEd.
60
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0061.png
Measures of Academic Progress (MAP)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Measures of Academic Progress (MAP)
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere elevers styrker og potentiale og anvende det til at fokusere undervisningen.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Matematik, læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 3-12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Ca. 45 min. pr. emne
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Ball, C.R. & O'Connor, E. 2016, "Predictive Utility and Classification Accuracy of Oral Reading
Fluency and the Measures of Academic Progress for the Wisconsin Knowledge and Con-
cepts Exam",
Assessment for Effective Intervention,
vol. 41, no. 4, pp. 195-208.
Lawon, M.A. 2017,
The Relationship between Language Literacy and ELL Student Academic
Performance in Mathematics
(Master thesis). Washington: Heritage University.
Matthews, M.S., Ritchotte, J.A. & McBee, M.T. 2013, "Effects of schoolwide cluster grouping
and within-class ability grouping on elementary school students’ academic achievement
growth",
High Ability Studies,
vol. 24, no. 2, pp. 81-97.
NWEA 2011,
Technical Manual. For Measures of Academic Progress for Primary Grades
(MPG).
Portland: Northwest Evaluation Association.
61
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0062.png
NWEA,
MAP Growth.
Tilgængelig på: https://www.nwea.org/map-growth/. Besøgt d. 18-09-
2019.
Stewart, G.N. 2016,
The effects of classroom physical activity on title I fifth-grade student math-
ematics and reading testing achievement.
Californien: Northcentral University.
Taylor, M. 2018,
Using the Lexia Reading Program to Increase NWEA MAP Reading Scores
in Grades 1 to 3.
Massachusetts: American International College.
Zito-Nash, J. 2017,
Impact of Sheltered Instruction Observation Protocol (SIOP) Strategies on
Reading Achievement of English Language Learners in the Primary Grades
(Doctoral dis-
sertation). Illinois: University of St. Francis.
62
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0063.png
Wechsler Individual Achievement Test (WIAT)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Wechsler Individual Achievement Test (WIAT)
USA, UK
Offentlig:
Privat:
Forskningsinstitution:
At identificere elevers faglige styrker, svagheder, uddannelsesmæssige placering samt
læringsevne.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle mellem 4 og 50 år
Alder/klassetrin: Alle grade levels
Fag: Læsning, skrivning, mundtlig fremstilling, matematik
Delskalaer:
Ja
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Online:
Andet:
Note:
Bruges også i andre sammenhænge end grundskolen
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 45-120 min. (afhænger af
klassetrin og antal deltests)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Costa, L.C., Edwards, C.N. & Hooper, S.R. 2016, "Writing Disabilities and Reading Disabilities
in Elementary School Students: Rates of Co-Occurrence and Cognitive Burden",
Learning
Disability Quarterly,
vol. 39, no. 1, pp. 17-30.
Doty, S.J., Hixson, M.D., Decker, D.M., Reynolds, J.L. & Drevon, D.D. 2015, "Reliability and
Validity of Advanced Phonics Measures",
Journal of Psychoeducational Assessment,
vol.
33, no. 6, pp. 503-521.
Marlow, R., Norwich, B., Ukoumunne, O.C., Hansford, L., Sharkey, S. & Ford, T. 2014, "A
comparison of teacher assessment (APP) with standardised tests in primary literacy and
numeracy (WIAT-II)",
Assessment in Education: Principles, Policy & Practice,
vol. 21, no.
4, pp. 412-426.
63
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0064.png
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019.
Vavassoeur, L.C. 2018,
Predictive power of the Test of Everyday Attention for Children (TEA-
Ch) on various methods of reading comprehension assessment among low-income fourth
grade children of color
(Doctoral dissertation). District of Columbia: Howard University.
Wechsleriqtest.org,
Wechsler Individual Achievement Test.
Tilgængelig på: https://wechs-
leriqtest.com/wiat/. Besøgt d. 18-09-2019.
64
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0065.png
Woodcock-Johnson IV Tests of Achievement
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Woodcock-Johnson IV Tests of Achievement
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere og potentielt diagnotisere både de særligt dygtige elever og de mere fagligt
udfordrede elever.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle
Fag: Læsning, skrivning og matematik
Delskalaer:
Ja
Alder/klassetrin: 4-90+ år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Kan eksempelvis identificere hovedskader, ADHD og andre udfordringer
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Dunn, K., Georgiou, G.K. & Das, J.P. 2018, "The PASS to Superior Reading Performance",
High Ability Studies,
vol. 29, no. 2, pp. 135-148.
Kendeou, P., Papadopoulos, T.C. & Spanoudis, G. 2012, "Processing demands of reading
comprehension tests in young readers",
Learning and Instruction,
vol. 22, no. 5, pp. 354-
367.
McCane‐Bowling, S.J., Strait, A.D., Guess, P.E., Wiedo, J.R. & Muncie, E. 2014, "The utility of
maze accurate response rate in assessing reading comprehension in upper elementary
and middle school students",
Psychology in the Schools,
vol. 51, no. 8, pp. 789-800.
Schrank, F.A., Mather, N., & McGrew, K.S. 2015, (Woodcock-Johnson IV Test of Achievement)
"Test Review", Journal
of Psychoeducational Assessment,
vol. 33, no. 4, pp. 391-398.
65
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Vavassoeur, L.C. 2018,
Predictive Power of the Test of Everyday Attention for Children (TEA-
Ch) on Various Methods of Reading Comprehension Assessment among Low-income
fourth Grade Children of Color
(Doctoral dissertation). District of Columbia.: Howard Uni-
versity.
Villanueva, C.S. 2015,
The Effects of Two Reading Interventions with Small-Groups of Second
Grade English Language Learners on Fluency and Comprehension (Doctoral disserta-
tion).
Oklahoma: Oklohoma State University.
66
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0067.png
Woodcock Reading Mastery Tests
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Woodcock Reading Mastery Tests
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere elevens styrker og svagheder i forhold til deres læseevner.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 5-75+ år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 15-45 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Han, J.N., Vanderwood, M.L. & Lee, C.Y. 2015, "Predictive Validity of Early Literacy Measures
for Korean English Language Learners in the United States",
International Journal of
School & Educational Psychology,
vol. 3, no. 3, pp. 178-188.
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019.
The Classroom,
Instructions on Scoring the Woodcock Reading Mastery Assessment.
Til-
gængelig på: https://www.theclassroom.com/instructions-woodcock-reading-mastery-as-
sessment-8611392.html. Besøgt d. 18-09-2019.
67
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0068.png
Texas State Assessment/STAAR Reading
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Texas State Assessment/STAAR Reading
USA/Texas
Offentlig:
Privat:
Forskningsinstitution:
At måle, hvorvidt eleven har lært og kan anvende den viden, som er defineret i det nationale
pensum.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: ?
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Lee, S.A. 2016,
Implementation of Professional Learning Communities in Title I Elementary
Schools and Student Performance in Reading: A Correlational Study
(Doctoral disserta-
tion). Dallas: Dallas Baptist University.
Lester, S.A. 2017,
The Effectiveness of Istation When Used for Computer-Assisted Instruction
(CAI) on the Overall Reading Ability Score of Primary Level Students
(Doctoral disserta-
tion). Texas: Texas A&M University.
Lorence, J. 2014, "Third-grade retention and reading achievement in Texas: A nine year panel
study",
Social Science Research,
vol. 48, pp. 1-19.
Rauch, A.L. 2017,
An Analysis of Two Dyslexia Interventions
(Doctoral dissertation). Texas:
Texas Woman’s University.
68
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Texas Education Agency, TEA, n.d.,
Technical Digest 2017-2018. Chapter 3: Standard Tech-
nical Processes.
Austin: Texas Educational Agency.
Wanzek, J., Roberts, G., Linan-Thompson, S., Vaughn, S., Woodruff, A.L. & Murray, C.S. 2010,
"Differences in the Relationship of Oral Reading Fluency and High-Stakes Measures of
Reading Comprehension",
Assessment for Effective Intervention,
vol. 35, no. 2, pp. 67-
77.
Wilkins, C., Gersten, R., Decker, L.E., Grunden, L., Brasiel, S., Brunnert, K., & Jayanthi, M.,
2012,
Does a Summer Reading Program Based on Lexiles Affect Reading Comprehen-
sion? Final Report. NCEE 2012-4006.
District of Columbia: National Center for Education
Evaluation and Regional Assistance.
69
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0070.png
Fountas and Pinnell Benchmark Assesment Systems
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Fountas & Pinnell Benchmark Assessment Systems
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere læseniveau for alle elever og dokumentere elevers udvikling. Kan anvendes til at
planlægge undervisningen.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Kindergarden - grade 8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Det er en samtale mellem lærer og elev ud fra en bog
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 20-40 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Bongle, K.A. 2018,
The Correlational Study of the STAR Reading Assessment When Com-
pared to the Fountas and Pinnell Benchmark Assessment System for Third Grade Stu-
dents
(Doctoral dissertation). Illinois: Concordia University Chicago.
Fountas & Pinnell Literacy
TM
,
Assessment.
Tilgængelig på: https://www.fountasandpin-
nell.com/assessment/. Besøgt d. 18-09-2019.
Harrington, S. 2017,
The Impact of the Fountas and Pinnell Benchmark Assessment System
on Third Grade South Carolina Ready English Language Arts Scores
(Doctoral disserta-
tion). North Carolina: Wingate University.
70
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0071.png
Partnership for Assessment of Readiness for College and Career
(PARCC)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Partnership for Assessment of Readiness for College and Career (PARCC)
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle elevers parathed til videre uddannelse (gennemføre college eller anden karriere).
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Herman, J.L., Matrundola, D.L.T., & Wang, J. 2015,
On the Road to Assessing Deeper Learn-
ing: What Direction Do Test Blueprints Provide? CRESST Report 849.
Californien: Na-
tional Center for Research on Evaluation, Standards, and Student Testing (CRESST).
Jiao, H. & Lissitz, R.W. 2016,
The next generation of testing: common core standards, smarter-
balanced, PARCC, and the nationwide testing movement.
North Carolina: Information
Age Publishing, Inc.
PARCC-assessment.org,
Ensuring Every Student Succeeds.
Tilgængelig på: https://parcc-
assessment.org/. Besøgt d. 18-09-2019.
PARCC 2019,
Final Technical Report for 2018 Administration.
District of Columbia: PARCC –
Partnership for Assessment of Readiness for College and Careers.
71
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0072.png
Stanford Achievement Test (SAT)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Stanford Achievement Test (SAT)
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere elevers styrker og behov, og anvende resultaterne til mere effektivt at planlægge
undervisningen. Samt at måle kvaliteten af elevernes uddannelse.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning, stavning, matematik
Delskalaer:
Ja
Alder/klassetrin: Kindergarden - grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 2,25-5,5 timer
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Foorman, B.R., Petscher, Y., Lefsky, E.B. & Toste, J.R. 2010, "Reading First in Florida: Five
Years of Improvement",
Journal of Literacy Research,
vol. 42, no. 1, pp. 71-93.
Foorman, B.R., Petscher, Y., & Schatschneider, C. 2015,
Florida Center for Reading Research
(FCRR) Reading Assessment (FRA): Grades 3 through 12. Technical Manual.
Florida:
Florida Center for Reading Research, Florida State University.
Foorman, B.R., Petscher, Y., & Stanley, C. 2016,
Latent Profiles of Reading and Language
and Their Association with Standardized Reading Outcomes in Kindergarten through 10th
Grade.
District of Columbia: Society for Research on Educational Effectiveness.
Gottfried, M.A. 2011, "Absent Peers in Elementary Years: The Negative Classroom Effects of
Unexcused Absences on Standardized Testing Outcomes",
Teachers College Record,
vol. 113, no. 8, pp. 1597-1632.
72
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0073.png
Gottfried, M.A. & Johnson, E.L. 2014, "Assessing Access: Is There Educational Equity within
Urban Schooling?",
Education and Urban Society,
vol. 46, no. 7, pp. 773-797.
Herrington, T.M. 2018,
Arizona's Move on When Reading: Was Earlier Identification of Those
Likely to Be Retained Possible?
(Doctoral dissertation). Arizona: Northern Arizona Uni-
versity.
Jimerson, S.R., Hong, S., Stage, S. & Gerber, M. 2013, "Examining Oral Reading Fluency
Trajectories among English Language Learners and English Speaking Students",
Journal
of New Approaches in Educational Research,
vol. 2, no. 1, pp. 3-11.
Pearson Assesments.com,
Stanford Achievement Test Series. Tenth Edition.
Tilgængelig på:
https://www.pearsonassessments.com/store/usassessments/en/Store/Professional-As-
sessments/Academic-Learning/Comprehensive/Stanford-Achievement-Test-Series-%7C-
Tenth-Edition/p/100000415.html. Besøgt d. 18-09-2019.
Petscher, Y., Kim, Y. & Foorman, B.R. 2011, "The Importance of Predictive Power in Early
Screening Assessments: Implications for Placement in the Response to Intervention
Framework",
Assessment for Effective Intervention,
vol. 36, no. 3, pp. 158-166.
Reutzel, D.R., Petscher, Y. & Spichtig, A.N. 2012, "Exploring the Value Added of a Guided,
Silent Reading Intervention: Effects on Struggling Third-Grade Readers' Achievement",
Journal of Educational Research,
vol. 105, no. 6, pp. 404-415.
Wanzek, J., Roberts, G., Linan-Thompson, S., Vaughn, S., Woodruff, A.L. & Murray, C.S. 2010,
"Differences in the Relationship of Oral Reading Fluency and High-Stakes Measures of
Reading Comprehension",
Assessment for Effective Intervention,
vol. 35, no. 2, pp. 67-
77.
73
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0074.png
Gates-MacGinitie Reading Tests (GMRT)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Gates-MacGinitie Reading Tests (GMRT)
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle elevens læseevner ift. delstatens og nationale læsestandarder, så læreren kan
identificere elevens vanskeligheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 1-12 og voksne
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Den tekniske rapport er ikke frit tilgængelig online.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 55-75 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Long, D. & Szabo, S. 2016, "E-Readers and the Effects on Students' Reading Motivation, Atti-
tude and Comprehension during Guided Reading",
Cogent Education,
vol. 3, no. 1, Article
1197818 2016.
Muijselaar, M.M.L., Kendeou, P., de Jong, P.F. & van, d.B. 2017, "What Does the CBM-Maze
Test Measure?",
Scientific Studies of Reading,
vol. 21, no. 2, pp. 120-132.
Petscher, Y., Kim, Y. & Foorman, B.R. 2011, "The Importance of Predictive Power in Early
Screening Assessments: Implications for Placement in the Response to Intervention
Framework",
Assessment for Effective Intervention,
vol. 36, no. 3, pp. 158-166.
Riverside Insights,
Gates-MacGinitie Reading Tests. Fourth Edition.
Tilgængelig på:
https://www.riverside-assessments.com/gmrt. Besøgt d. 18-09-2019.
74
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Shannon, L. & Grant, B. 2015,
A Final Report for the Evaluation of the Achieve3000 Programs.
Virginia: Magnolia Consulting.
Verlaan, W., Pearce, D.L. & Zeng, G. 2017, "Revisiting Sticht: The Changing Nature of the
Relationship between Listening Comprehension and Reading Comprehension among Up-
per Elementary and Middle School Students over the Last 50 Years",
Literacy Research
and Instruction,
vol. 56, no. 2, pp. 176-197.
75
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0076.png
Diamant (basal matematik)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Diamant (basal matematik)
Sverige
Offentlig:
Privat:
Forskningsinstitution:
At følge op på elevens matematikfærdigheder ift. til det svenske matematikpensum.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle svenske skolebørn (frivilligt)
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Årskurs 1-9
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet: Udviklingsskema
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 127
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Löwing, M. 2016,
Diamant - diagnoser i matematik: ett kartläggningsmaterial baserat på didak-
tisk ämnesanalys.
Göteborg: Acta universitatis Gothoburgensis.
Skolverket 2013,
Diamant. Diagnoser i matematik. Årskurs 1-9 (Rev. 2013).
Stockholm: Skol-
verket.
76
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0077.png
Developmental Reading Assessment (DRA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Developmental Reading Assessment (DRA)
USA
Offentlig:
Privat:
Forskningsinstitution:
At systematisk observere og evaluere ændringer i elevers læseevne.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
DRA2 er den nuværende udgave
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Varierer mellem klassetrin
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Beaver og Carter, n.d.,
DRA2+. One Teacher, One Student. Assessment for Personalized In-
struction.
London: Pearson Assessments.
Gregory, B. 2017,
The Effect of Guided Reading on Literacy Achievement of Third and Fourth
Grade Students
(Doctoral dissertation). Missouri: Missouri Baptist University.
Osowski, M.I. 2017,
The Predictability of New Mexico's Summative Reading Assessment by
Two Commonly Used Early Literacy Assessments, the Dynamic Indicators of Basic Early
Literacy Skills Next ("DIBELS Next") and the Developmental Reading Assessment-Sec-
ond Edition (DRA2)
(Doctoral dissertation). New Mexico: The University of New Mexico.
Pearson, 2011,
K-8 Technical Manual. Developmental Reading Assessment
®
.
London: Pear-
son Education, Inc.
Rauch, A.L. 2017,
An Analysis of Two Dyslexia Interventions
(Doctoral dissertation). Texas:
Texas Woman’s University.
77
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0078.png
Reading Inventory and Scholastic Evaluation
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Reading Inventory and Scholastic Evaluation
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere styrker og svagheder ift. forskellige færdigheder inden for læsning.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 5-10
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: En time
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Conoyer, S.J., Lembke, E.S., Hosp, J.L., Espin, C.A., Hosp, M.K. & Poch, A.L. 2017, "Getting
More from Your Maze: Examining Differences in Distractors",
Reading & Writing Quar-
terly,
vol. 33, no. 2, pp. 141-154.
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d 18-09-2019
Purvis, J.S. 2017,
The Relationship between Reading Fluency and Lexile Measures
(Doctoral
dissertation). Virginia: Liberty University.
Sabatini, J., Bruce, K., Steinberg, J. & Weeks, J. 2015,
SARA Reading Components Tests,
RISE Forms: Technical Adequacy and Test Design, 2nd Edition.
New Jersey: ETS.
Serpmedia.org,
RISE, What is the RISE?
Tilgængelig på: https://serpme-
dia.org/rise/index.html. Besøgt d. 18-09-2019.
78
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0079.png
Kaufmann Test of Educational Achievement
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Kaufmann Test of Educational Achievement
US
Offentlig:
Privat:
Forskningsinstitution:
Undersøge og evaluere centrale faglige færdigheder i dybden
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Alder/klassetrin: 4-25 år
Fag: Læsning, stavning, mundtlig fremstilling, matematik
Delskalaer:
Ja
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 10-35 min. pr. deltest (30-85 min.
for den udvidede)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Scheiber, C. 2017, "Does the KABC-II display ethnic bias in the prediction of reading, math,
and writing in elementary school through high school?",
Assessment,
vol. 24, no. 6, pp. 729-
745.
Vladescu, J.C. 2007, "Test Review: Kaufman Test of Educational Achievement - Second Edi-
tion (KTEA- II)",
Journal of Psychoeducational Assessment,
vol. 25, no. 1, pp. 92-100.
79
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0080.png
Kartleggingsprøver
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Kartleggingsprøver
Norge
Offentlig:
Privat:
Forskningsinstitution:
At opdage de elever i grundskolen, som har brug for ekstra opfølgning.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning, regning
Delskalaer:
Ja
Alder/klassetrin: 1.-4. trinn
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet: Rapport
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 45 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Utdanningsdirektoratet
2019,
Kva
er
kartleggingsprøver?.
Tilgængelig
på:
https://www.udir.no/eksamen-og-prover/prover/hva-er-kartleggingsprover/. Besøgt d. 18-09-
2019.
Utdanningsdirektoratet 2017,
Kartleggingsprøve i lesing 1. trinn. Bokmål.
Oslo: Utdanningsdi-
rektoratet.
Walgermo, B.R., Uppstad, P.H., Lundetræ, K., Tønnessen, F.E. & Solheim, O.J. 2018, "Kart-
leggingsprøver i lesing - tid for nytenking?",
Acta Didactica Norge,
vol. 12, no. 4, pp. 21-21.
80
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0081.png
Standardiseret test i avkoding og stavning (STAS)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
STAS (standardiseret test i avkoding og stavning)
Norge
Offentlig:
Privat:
Forskningsinstitution:
At opdage læsevanskeligheder tidligt, kortlægge læseprocessen, tilpasse
hjælpen/undevisningen og følge op på udviklingen.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever
Fag: Afkodning, stavning
Delskalaer:
Ja
Alder/klassetrin: 2.-10. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet: Regneark
Note:
Den findes i både en screeningsudgave og en "klinisk" udgave, hvor den første er for alle og den
sidste til elever med behov for en mere nøjagtig kortlægning.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: ?
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Gjestsen, Å.K. 2010,
Leseferdighet – vurdering og observasjon (Power points).
Stavanger: Le-
sesenteret, Universitetet i Stavanger.
Stenvik, K.E. 2009, "Lesetester i ungdomsskolen",
Norsk tidsskrift for logopedi,
vol. 55, no. 2,
pp. 16-21.
81
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0082.png
North Carolina End of Grade Assessment of Reading Comprehension
(NCEOG)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
North Carolina End of Grade Assessment of Reading Comprehension (NCEOG)
USA/North Carolina
Offentlig:
Privat:
Forskningsinstitution:
At måle, om eleverne opnår læringsmålene i det statslige pensum.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever på folke-, privat- og
charterskoler
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 52-56
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 140-240 min. (afhængig af
klassetrin)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Bazemore, M., & Van Dyk, P.B. 2004,
NC Reading Comprehension Test Technical Report.
Raleigh: The Office of Curriculum and School Reform Services.
Bowles, A.S. 2015, "Does mClass Reading 3D Predict Student Reading Proficiency on High-
Stakes Assessments?",
Journal of Organizational and Educational Leadership,
vol. 1, no.
1, pp.1-28.
Greene, D.H. 2015,
An Evaluation of the Relationship among State Accountability Reading
Test Scores and Levels of Language Proficiency of English Language Learners
(Doctoral
dissertation). North Carolina: Gardner-Webb University.
Public Schools of North Carolina,
North Caroline End-of-Grade English Language Arts/Read-
ing Grades 3-8.
Tilgængelig på:
http://www.ncpublicschools.org/accountability/te-
sting/eog/reading/
. Besøgt d. 18-09-2019.
82
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0083.png
Missouri Assessment Program (MAP)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Missouri Assessment Program (MAP)
USA/Missouri
Offentlig:
Privat:
Forskningsinstitution:
At teste elevernes udvikling ift. statslige standarder
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Offentlige grund- og charterskoler
Fag: Engelsk, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 75-150 min. (afhængig af
klassetrin og fag)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Conoyer, S.J., Foegen, A. & Lembke, E.S. 2016, "Early Numeracy Indicators",
Remedial &
Special Education,
vol. 37, no. 3, pp. 159-171.
Conoyer, S.J., Lembke, E.S., Hosp, J.L., Espin, C.A., Hosp, M.K. & Poch, A.L. 2017, "Getting
More from Your Maze: Examining Differences in Distractors",
Reading & Writing Quar-
terly,
vol. 33, no. 2, pp. 141-154.
Data Recognition Corporation 2017,
Grades 3-8 English Language Arts and Mathematics,
Grades 5 and 8 Science. Technical Report 2017.
Missouri: Missouri Department of Ele-
mentary and Secondary Education.
Missouri Department of Elementary & Secondary Education,
Assessment.
Tilgængelig på:
https://dese.mo.gov/college-career-readiness/assessment#mini-panel-assessment4.
Besøgt d. 18-09-2019.
83
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0084.png
Common Core standardized test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Common Core standardized test
USA
Offentlig:
Privat:
Forskningsinstitution:
At benchmarke elever og skoler ift. at kunne forbedre policy på området.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle folkeskoleelever (i de stater,
der har indført den)
Fag: Læsning, skrivning, tale og lytte, matematik
Delskalaer:
Ja
Alder/klassetrin: Kindergarden - grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
41 stater anvender i dag testen
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Crowder, Z. & Konle, S. 2015, "Gumbo Ya-Ya or, What Pearson Can't Hear: Opt-Out, Stand-
ardized Testing, and Student Surveillance",
High School Journal,
vol. 98, no. 4, pp. 285-
289.
The University of the State of New York,
New York State Regents Examination in English
Language Arts, 2017 Technical Report.
London: Pearson Assessment.
Witmer, S.E., Duke, N.K., Billman, A.K. & Betts, J. 2014, "Using assessment to improve early
elementary students’ knowledge and skills for comprehending informational text",
Journal
of Applied School Psychology,
vol. 30, no. 3, pp. 223-253.
Zito-Nash, J. 2017,
Impact of Sheltered Instruction Observation Protocol (SIOP) Strategies on
Reading Achievement of English Language Learners in the Primary Grades
(Doctoral dis-
sertation). Illinois: University of St. Francis.
84
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0085.png
Florida Reading Assessment (FRA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Florida Reading Assessment (FRA)
USA/Florida
Offentlig:
Privat:
Forskningsinstitution:
At screene og diagnosticere elever.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning, mundtlig fremstilling
Delskalaer:
Ja
Alder/klassetrin: Grade 1-10
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Spørgsmålsbanken består af
1.027 items
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Ubegrænset
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Foorman, B.R., Petscher, Y., & Schatschneider, C. 2015,
Florida Center for Reading Research
(FCRR) Reading Assessment (FRA): Grades 3 through 12. Technical Manual.
Florida:
Florida Center for Reading Research, Florida State University.
Foorman, B.R., Petscher, Y., & Stanley, C. 2016,
Latent Profiles of Reading and Language
and Their Association with Standardized Reading Outcomes in Kindergarten through 10th
Grade.
District of Columbia: Society for Research on Educational Effectiveness.
85
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0086.png
Matematikprofilen
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Matematikprofilen
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At måle elevens matematiske færdigheder ift. fælles mål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: 1.-3. kl.
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 54
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Tre timer
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Freil, O. 2018,
Matematikprofilen 1: matematikevaluering til fælles mål.
København: Gyldendal.
Freil, O. 2018,
Matematikprofilen 2: matematikevaluering til fælles mål.
København: Gyldendal.
Freil, O. 2018,
Matematikprofilen 3: matematikevaluering til fælles mål.
København: Gyldendal.
Gyldendal,
Velkommen til Matematikprofilen.
Tilgængelig på: https://matematikprofilen.gylden-
dal.dk. Besøgt d. 18-09-2019.
86
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0087.png
Individuel Læseundersøgelse – basis (IL-basis)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Individuel Læseundersøgelse – basis (IL-basis)
Danmark og Norge
Offentlig:
Privat:
Forskningsinstitution:
At kunne træffe beslutninger om igangsætning af særlige undervisningstiltag for elever med
læsevanskeligheder identificeret ud fra testens resultater.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle i klassen eller kun enkelte
elever
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Indskoling (1.-2. trinn i Norge)
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Består af tre individuelle prøver og en gruppeprøve. Bruges ofte efter OS-prøverne
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Gruppeprøven: 10-20 min.
Individuelle: ca. 15 min. pr. del
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Frost, J. & Nielsen, J.C. 2015,
IL-Basis: Individuel- og gruppeprøve til vurdering af læseforud-
sætninger og læseforståelse i indskolingen.
Virum: Hogrefe.
Gjestsen, Å.K. 2010,
Leseferdighet – vurdering og observasjon (Power points).
Stavanger: Le-
sesenteret, Universitetet i Stavanger.
87
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0088.png
ACT Reading Aspire Assessments
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
ACT Reading Aspire Assessments
USA
Offentlig:
Privat:
Forskningsinstitution:
At kunne forudsige elevers udvikling de næste to år og at kunne give lærerne de rette
undervisningsredskaber.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skoleelever (nogle af testene
er dog ikke for alle)
Fag: Engelsk, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-10
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Interim: 45 min. Klasseværelse:
10-15 min. Summative: 40-75 min
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
ACT 2019,
The ACT
®
Technical Manual.
Iowa: ACT, inc.
ACT.org,
The ACT Test.
Tilgængelig på: https://www.act.org/. Besøgt d. 18-09-2019.
Gohanna, S.J. 2018,
Examining the relationship among reading coaches, student achieve-
ment, and accommodation status of third grade students taking the ACT aspire reading
assessments
(Doctoral dissertation). Alabama: Alabama A&M University.
Rebus, P.J. 2015,
Investigating the appropriate assessment of secondary students' reading
ability: An examination of curriculum-based measures of reading at the middle school
level
(Doctoral dissertation). Illinois: Northern Illinois University.
88
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0089.png
Curriculum-Based Measure test (CBM-Maze)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Curriculum-Based Measure test (CBM-Maze)
USA
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevens læseniveau samt at kunne følge udviklingen herfor over tid.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 2-9
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet: Udviklingsgraf
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 5-10 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Kendeou, P., Papadopoulos, T.C. & Spanoudis, G. 2012, "Processing demands of reading
comprehension tests in young readers",
Learning and Instruction,
vol. 22, no. 5, pp. 354-
367.
Muijselaar, M.M.L., Kendeou, P., de Jong, P.F. & van den Broek, P.W. 2017, "What Does the
CBM-Maze Test Measure?",
Scientific Studies of Reading,
vol. 21, no. 2, pp. 120-132.
Weschler, M.J. 2016,
Does Student Proficiency on Local Reading Assessment Measures Align
with State Mandated Reading Proficiency Standards? An Investigation of the Relationship
between the Developmental Reading Assessment, Reading Curriculum Based Measure-
ment, and Maze, with the New York State English Language Arts Exam
(Doctoral disser-
tation). New Jersey: Fairleigh Dickinson University.
Wright 2013,
How To: Assess Reading Comprehension with CBM: Maze Passages.
www.in-
terventioncentral.org
89
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0090.png
Gray Oral Reading Tests (GORT-5)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Gray Oral Reading Tests (GORT-5)
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere elever med behov for en mere intensiv og eksplicit undervisningsløsning ift. at
opnå den ønskede udvikling.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Udtale, læsning
Delskalaer:
Ja
Alder/klassetrin: 6-23 år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 20-30 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
La Marca, J.P. & O'Connor, R.E. 2016, "Neurofeedback as an Intervention to Improve Reading
Achievement in Students with Attention- Deficit/Hyperactivity Disorder, Inattentive Sub-
type",
Grantee Submission,
vol. 3, pp. 55-77.
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019.
Pearson,
Gray Oral Reading Test, Fifth Edition.
Tilgængelig på: https://www.pearsonasses-
sments.com/store/usassessments/en/Store/Professional-Assessments/Speech-%26-
Language/Gray-Oral-Reading-Test-%7C-Fifth-Edition/p/100000106.html. Besøgt d. 18-
09-2019.
Wigal, S.B., Maltas, S., Crinella, F., Stehli, A., Steinhoff, K., Lakes, K. & Schuck, S. 2012,
"Reading Performance as a Function of Treatment with Lisdexamfetamine Dimesylate in
Elementary School Children Diagnosed with ADHD",
Journal of Attention Disorders,
vol.
16, no. 1, pp. 23-33.
90
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0091.png
Test of Word Reading Efficiency (TOWRE-2)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Test of Word Reading Efficiency (TOWRE-2)
USA
Offentlig:
Privat:
Forskningsinstitution:
At kunne vurdere elevens evne til at udtale trykte ord.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Udtale
Delskalaer:
Ja
Alder/klassetrin: 6-24 år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 5-10 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019.
Pro-Ed,
TOWRE-2 Test of Word Reading Efficiency-Second Edition, COMPLE KIT.
Tilgæn-
gelig på: https://www.proedinc.com/Products/13910/towre2-test-of-word-reading-efficien-
cysecond-edition-complete-kit.aspx. Besøgt d. 18-09-2019.
Quirk, M., Schwanenflugel, P.J. & Webb, M. 2009, "A Short-Term Longitudinal Study of the
Relationship between Motivation to Read and Reading Fluency Skill in Second Grade",
Journal of Literacy Research,
vol. 41, no. 2, pp. 196-227.
91
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0092.png
World-Class Instructional Design and Assessment-Assessing
Comprehension and Communication in English State to State (WIDA-
ACCESS)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
World-Class Instructional Testdesign and Assessment-Assessing Comprehension and
Communication in English State to State (WIDA-ACCESS)
USA
Offentlig:
Privat:
Forskningsinstitution:
At teste elevens færdigheder ift. nationale krav og at kunne rapportere fremgangen.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning, lytte, tale, skrive
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 180 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Greene, D.H. 2015,
An Evaluation of the Relationship among State Accountability Reading
Test Scores and Levels of Language Proficiency of English Language Learners
(Doctoral
dissertation). North Carolina: Gardner-Webb University.
WIDA,
Access Tests.
Tilgængelig på: https://wida.wisc.edu/assess/access/tests. Besøgt d.
18-09-2019.
WIDA, 2018,
Annual Technical Report for ACCESS for ELLs
®
2.0 Online English Language
Proficiency Test, Series 401, 2016-2017.
Wisconsin: Center for Applied Linguistics.
Zito-Nash, J. 2017,
Impact of Sheltered Instruction Observation Protocol (SIOP) Strategies on
Reading Achievement of English Language Learners in the Primary Grades
(Doctoral dis-
sertation). Illinois: University of St. Francis.
92
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0093.png
Carlstenprøverne
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Carlstenprøverne
Norge
Offentlig:
Privat:
Forskningsinstitution:
At give læreren enkel og relevant information om elevens læsefærdigheder og -forståelse.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Læsning, stavning
Delskalaer:
Ja
Alder/klassetrin: 1.-10. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Testen blev fornyet i 2016.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 25
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Carlstenprøvene (Leseprøve - revidert utgave 2016).
Tilgængelig på: https://www.cappelen-
dammundervisning.no/verk/carlstenpr%C3%B8vene-126517#produkter. Besøgt d. 18-09-
2019.
93
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0094.png
National Assesment Study
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
National Assesment Study
Tyskland
Offentlig:
Privat:
Forskningsinstitution:
At følge udviklingen ift. at opfylde de nationale læringsmål på tværs af delstater.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Folkeskoler, inkl. "Waldorfschulen"
og "Förderschulen". Frivilligt for privatskoler
Fag: Tysk, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3 og 8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 160 min. (80 min. pr fag)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Heppt, B., Haag, N., Böhme, K. & Stanat, P. 2015, "The Role of Academic-Language Features
for Reading Comprehension of Language-Minority Students and Students from Low-SES
Families",
Reading Research Quarterly,
vol. 50, no. 1, pp. 61-82.
Institut zur Qualitätsentwicklung im Bildungswesen,
Ländervergleich 2011 in der Primarstufe.
Tilgængelig på: https://www.iqb.hu-berlin.de/bt/LV2011. Besøgt d. 18-09-2019.
Stanat, P., Pant, H.A., Böhme, K., & Richter, D. 2012,
Kompetenzen von Schülerinnen und
Schülern am Ende der vierten Jahrgangsstufe in den Fächern Deutsch und Mathematik.
München: Waxmann.
94
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0095.png
Periodic National Assessment (PPON)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Periodic National Assessment (PPON)
Holland
Offentlig:
Privat:
Forskningsinstitution:
At informere ministeriet og andre uddannelsesinstitutioner omkring grundskolelevers
færdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle folkeskoleelever
Fag: Hollandsk sprog, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 6
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Kendes også som CITO tests.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Hickendorff, M., Heiser, W. J., Van Putten, C. M., & Verhelst, N. D. 2009, ”Solution strategies
and achievement in Dutch complex arithmetic: Latent variable modeling of change”.
Psy-
chometrika, 74(2),
331-350.
95
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0096.png
New Mexico Standards-based Assessment
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
New Mexico Standards-based Assessment
USA/New Mexico
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes opnåelse af statens pensum samt at kunne vurdere, hvorvidt de forskellige
skoler lever op til statens standarder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle folkeskoleelever
Fag: Matematik, læsning, skrivning
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8 og 11
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 40-60
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Griph, G. W. & Zhang, H. 2006,
New Mexico Standards Based Assessment (NMSBA). Tech-
nical Report: 2006 Spring Administration.
San Antonio: Harcout Assessment, Inc.
Osowski, M.I. 2017,
The Predictability of New Mexico's Summative Reading Assessment by
Two Commonly Used Early Literacy Assessments, the Dynamic Indicators of Basic Early
Literacy Skills Next ("DIBELS Next") and the Developmental Reading Assessment-Sec-
ond Edition (DRA2)
(Doctoral dissertation). New Mexico: The University of New Mexico.
96
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0097.png
Provincial Achievement test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Provincial Achievement test
USA/Alberta
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes viden og færdigheder ift. provinsens læringsmål, samt monitorere skolerne.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Matematik, sprog (fransk og engelsk)
Delskalaer:
Ja
Alder/klassetrin: Grade 6 og 9
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Typisk 1-2 timer pr. deltest. 2-4
deltests i sprog, 2 deltest i mat (grade 6)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Alberta Education 2018,
General Information Bulletin. Provincial Achievement Testing Pro-
gram, Grades 6 and 9. 2018-2019 School Year.
Edmonton: Provincial Assessment Sec-
tor.
Janzen, T., Cormier, D.C., Hetherington, J., Mrazik, M. & Mousavi, A. 2015, "A Canadian In-
vestigation of the Psychometric Properties of the Student Motivation and Learning Strate-
gies Inventory",
Canadian Journal of School Psychology,
vol. 30, no. 3, pp. 175-192.
97
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0098.png
Primary School Leaving Examination (PSLE)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Primary School Leaving Examination (PSLE)
Singapore
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes afgangsniveau og anvende dette til at placere eleverne i udskolingen.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Alder/klassetrin: Grade 6
Fag: Matematik, sprog (kinesisk, malaysisk, tamilsk)
Delskalaer:
Ja
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Fra 1-4 timer pr. deltest
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Loh, T.L. & Shih, C. 2016, "The English Language Test of the Singapore Primary School Leav-
ing Examination",
Language Assessment Quarterly,
vol. 13, no. 2, pp. 156-166.
SEAB (Singapore Examinations and Assessment Board):
PSLE.
Tilgængelig på:
https://www.seab.gov.sg/home/examinations/psle. Besøgt d. 18-09-2019.
98
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0099.png
Tinfolec
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Tinfolec
Frankrig
Offentlig:
At vurdere elevernes læseevner.
Pædagogisk værktøj:
Andet:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 5 opgaver med hhv. 60, 24, 24, 40
og 40 items i hver
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 5 sessioner af 25 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Ja
Nej
Alder/klassetrin: 2.-5. klasse
Styringsredskab:
Screeningsværktøj:
Privat:
Forskningsinstitution:
Litteratur
Beauvais, L., Bouchafa, H., Beauvais, C., Kleinsz, N., Magnan, A. & Ecalle, J. 2018, "Tinfolec:
A New French Web-Based Test for Reading Assessment in Primary School",
Canadian
Journal of School Psychology,
vol. 33, no. 3, pp. 227-241.
99
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0100.png
Terra Nova
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Terra Nova
USA
Offentlig:
Privat:
Forskningsinstitution:
At vurdere den enkelte elevs udvikling i kompetencer og færdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Sprog, matematik
Delskalaer:
Ja
Alder/klassetrin: Kindergarten-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 136-174 samlet på tværs af
deltests
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 4:10-5:35 min. (afhængig af
klassetrin)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Biancarosa, G., Bryk, A.S. & Dexter, E.R. 2010, "Assessing the Value-Added Effects of Literacy
Collaborative Professional Development on Student Learning",
Elementary School Jour-
nal,
vol. 111, no. 1, pp. 7-34.
CTB, McGraw-Hill, n.d.,
Introducing TerraNova,
TM
Third Edition, The New Standard in
Achievement.
Californien: CTB/McGraw-Hill.
Data Recognition Corporation 2017,
TerraNova,
Third Edition. Redefining Assessment.”
100
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0101.png
Multiple-Choice Online Causal Comprehension Assessment (MOCCA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Multiple-Choice Online Causal Comprehension Assessment (MOCCA)
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes læseforståelse og identificere svage læsere.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 3-5
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 40
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Ubegrænset, men læreren kan
begrænse til fx 30, 45 eller 60 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Davison, M.L., Biancarosa, G., Carlson, S.E., Seipel, B. & Liu, B. 2018, "Preliminary Findings
on the Computer-Administered Multiple-Choice Online Causal Comprehension Assess-
ment, a Diagnostic Reading Comprehension Test",
Assessment for Effective Intervention,
vol. 43, no. 3, pp. 169-181.
101
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0102.png
Zahlenverarbeitung und Rechnen bei Kindern (Zareki-R)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Zahlenverarbeitung und Rechnen bei Kindern
(
Zareki-R)
Frankrig, Tyskland
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes grundlæggende færdigheder i matematik.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: 1.-4. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 12 opgaver med 2-22 items i hver
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 15-30 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
De Clercq-Quaegebeur, M., Casalis, S., Vilette, B., Lemaitre, M. & Vallée, L. 2018, "Arithmetic
Abilities in Children with Developmental Dyslexia: Performance on French ZAREKI-R
Test",
Journal of learning disabilities,
vol. 51, no. 3, pp. 236-249.
102
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0103.png
FastaReada
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
FastaReada
Australien
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes højtlæsningsevner.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 9-12 år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Testen er udviklet til forskning, og ovenstående er baseret på en forskningsartikel. Det er uvist,
om den også sættes i brug efterfølgende.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Elhassan, Z., Crewther, S.G., Bavin, E.L. & Crewther, D.P. 2015, "Preliminary validation of
FastaReada as a measure of reading fluency",
Frontiers in Psychology,
vol. 6, Article
1634, pp. 1-10.
103
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0104.png
Neale Analysis of Reading Ability (NARA-3)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Neale Analysis of Reading Ability (NARA-3)
Australien
Offentlig:
Privat:
Forskningsinstitution:
At måle og vurdere elevers læsefærdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 6-12 år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Seks afsnit, der skal læses højt
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: ca. 20 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Elhassan, Z., Crewther, S.G., Bavin, E.L. & Crewther, D.P. 2015, "Preliminary validation of
FastaReada as a measure of reading fluency",
Frontiers in Psychology,
vol. 6, Article
1634, pp. 1-10.
104
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0105.png
DL-prøven (Diagnostisk læse- og staveprøve)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
DL-prøven (Diagnostisk læse- og staveprøve)
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At kortlægge og diagnosticere elevernes færdigheder og udfordringer i læsning og stavning.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning, stavning
Delskalaer:
Ja
Alder/klassetrin: 1.-4. klasse
Nej
Testprincip
Indhold:
Antal Items: 10 delprøver. 24 læsetekster lix 5-
31, 18 højtlæsningsord, 18 ord til stavning, 18
ord til indsættelsesdiktat m.m.
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Forældre:
Andet:
Elev:
Lærer:
Myndighed:
Karaktergivning:
Kriteriebaseret:
Andet:
Normbaseret:
Skaleret score:
Visualisering:
Online:
Andet:
På papir:
Note:
Bygger på "SUP-materialet" og deler teoretisk baggrund med "CHIPS"
Litteratur
Halleby, C., Kjær, K. & Norrbom, L. 2004,
DL-Prøven: Diagnostisk læse- og staveprøve. Indvi-
duel vurdering af læsning og stavning fra læsebegyndere til voksne,
Hogrefe, Virum.
105
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0106.png
Online RAW-test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Offentlig:
Privat:
Forskningsinstitution:
Online RAW-test
At måle elevernes basale færdigheder i læsning, regning og stavning.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Læsning, regning, skrivning
Delskalaer:
Ja
Alder/klassetrin: Grade 1-5
Nej
Testprincip
Indhold:
Antal Items: 221 gode items. Der er 20 "marks"
for læsning, 20 "marks" for aritmetik og 10
"marks" for stavning
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Forældre:
Andet:
Elev:
Lærer:
Myndighed:
Karaktergivning:
Kriteriebaseret:
Andet:
Normbaseret:
Skaleret score:
Visualisering:
Online:
Andet:
På papir:
Note:
Testen er udviklet til forskning, herunder sammenligning af eksisterende tests, men det er uvist
om den også sættes i brug efterfølgende.
Litteratur
Hanif, M., Khan, T.A., Masroor, U. & Amjad, A. 2017, "Development of Online Raw Achieve-
ment Battery Test for Primary Level",
Cogent Education,
vol. 4, no. 1., Article 1290332,
pp.1-9.
106
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0107.png
Wide Range Achievement
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Wide Range Achievement
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes basale færdigheder i læsning, regning og stavning.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning, stavning, regning
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Testen foretages på individer eller mindre grupper
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 15-30 min. (afhængig af alder)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Hanif, M., Khan, T.A., Masroor, U. & Amjad, A. 2017, "Development of Online Raw Achieve-
ment Battery Test for Primary Level",
Cogent Education,
vol. 4, no. 1, Article 1290332,
pp.1-9.
Pearson,
Wide Range Achievement Test, Fifth Edition.
Tilgængelig på: https://www.pearson-
clinical.co.uk/Psychology/ChildCognitionNeuropsychologyandLanguage/ChildAchieve-
mentMeasures/wrat5/wide-range-achievement-test-fifth-edition-wrat5.aspx. Besøgt d. 18-
09-2019.
107
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0108.png
Matematik Grundlæggende, Færdigheder Grundlæggende (MG/FG)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Matematik Grundlæggende, Færdigheder Grundlæggende (MG/FG)
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At kortlægge og diagnosticere elevernes grundlæggende færdigheder og udfordringer i
matematik.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: MG til alle klassetrin, FG fra
4. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet: Skolen
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Hansen, K.F.
MG/FG: Matematik Grundlæggende, Færdigheder Grundlæggende - Diagnosti-
cering af grundlæggende færdigheder i matematik,
Hogrefe, Virum.
108
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0109.png
South Carolina College-and-Career Ready Assesments – English
Language Arts (SC READY ELA)
Testbeskrivelse
Navn:
South Carolina College-and-Career Ready Assesments – English Language Arts (SC READY
ELA)
USA/South Carolina
Testudvikler:
Formål:
Anvendelse:
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes viden og færdigheder ift. de statsligt fastsatte læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever i staten
Fag: English Language Arts (ELA)
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Ubegrænset, men to sessioner
over to dage
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Harrington, S. 2017,
The Impact of the Fountas and Pinnell Benchmark Assessment System
on Third Grade South Carolina Ready English Language Arts Scores
(Doctoral disserta-
tion). North Carolina: Wingate University.
109
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0110.png
Matematikvurdering
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Matematikvurdering
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At vurdere indskolingselevers forudsætninger for matematik.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: 1.-3. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Andet: Kriteriebaseret, men scoringsprogrammet giver mulighed for at sammenholde med
normer for klassetrinnet
Visualisering:
Online:
Andet:
Note:
På papir:
Litteratur
Heinze, I. & Kemner, K.L. 2016,
Matematikvurdering 1.-3. klasse: vejledning. Et materiale til
vurdering af elevernes matematiske forudsætninger,
1. udg., Dansk Psykologisk Forlag,
[Kbh.].
110
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0111.png
LäsEttan
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
LäsEttan
Sverige
Offentlig:
Privat:
Forskningsinstitution:
At teste elevernes læseafkodning og bogstavskendskab.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 1. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Johansson, M. 2009,
LäsEttan. Test i avkodning och bokstavskännedom: för kartläggning och
säkerställande av nybörjarläsning. Handledning med kopieringsunderlag,
Natur & kultur,
Stockholm.
111
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0112.png
Ein Leseverständnistest für Erst- bis Siebtklässler Version II (ELFE II)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Ein Leseverständnistest für Erst- bis Siebtklässler Version II (ELFE II)
Tyskland
Offentlig:
Privat:
Forskningsinstitution:
At teste elevernes læseforståelse.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 1.-7. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Ord: 75, sætning: 36, tekst: 26
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Ord: 3 min., sætning: 3 min.,
tekst: 7 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Lenhard, W., Schroeders, U. & Lenhard, A. 2017, "Equivalence of Screen versus Print Read-
ing Comprehension Depends on Task Complexity and Proficiency",
Discourse Pro-
cesses: A Multidisciplinary Journal,
vol. 54, no. 5, pp. 427-445.
Testzentrale,
ELFE II.
Tilgængelig på: https://www.testzentrale.de/shop/ein-leseverstaend-
nistest-fuer-erst-bis-siebtklaessler.html. Besøgt d. 18-09-2019.
112
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0113.png
Lesesenterets staveprøve
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Lesesenterets staveprøve
Norge
Offentlig:
Privat:
Forskningsinstitution:
At give en diagnostisk information om elevers stavevanskeligheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Stavning
Delskalaer:
Ja
Alder/klassetrin: 3.-10. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 32 ord
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Lesesenteret 2019,
Lesesenterets staveprøve.
Tilgængelig på: https://lesesenteret.uis.no/ca-
tegory.php?categoryID=14022&s=14022. Besøgt d. 18-09-2019.
Lesesenteret,
Standardisert staveprøve frå Lesesenteret:
Tilgængelig på: https://lesesente-
ret.uis.no/om-lesesenteret/aktuelt/standardisert-staveprove-fra-lesesenteret-article82111-
12719.html. Besøgt d. 18-09-2019.
113
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0114.png
Ordkjedetesten
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Ordkjedetesten
Norge
Offentlig:
Privat:
Forskningsinstitution:
At screene og derigennem opdage elever, der har vanskeligheder i at afkode ord
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Afkodning af ord
Delskalaer:
Ja
Alder/klassetrin: 3.-10. klasse og voksne
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 90 ordkæder
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 10 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Lesecenteret,
Ordkjedetesten.
Tilgængelig på:
https://lesesenteret.uis.no/article.php?ar-
ticleID=86612&categoryID=14020. Besøgt d. 18-09-2019.
Logometrica 2019,
Ordkjedetesten.
Tilgængelig på: https://logometrica.no/produkt/ordkjede-
testen. Besøgt d. 18-09-2019.
114
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0115.png
Louisiana Educational Assessment Programme (LEAP)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Louisiana Educational Assessment Programme (LEAP)
USA/Louisiana
Offentlig:
Privat:
Forskningsinstitution:
At hjælpe undervisere med at bedømme elevernes udvikling fra år til år ift. de statsligt fastsatte
læringsmål
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever i staten
Fag: English Language Arts (ELA), matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 4 og 8
Nej
Testprincip
Indhold:
Antal Items: ELA: 88 (grade 4), mat: 63 (grade
4)
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: To faser over to dage inddelt i
forskellige sessioner (sammenlagt 11 timer for
grade 4)
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Elev:
Lærer:
Myndighed:
Karaktergivning:
Kriteriebaseret:
Andet:
Normbaseret:
Skaleret score:
Visualisering:
Online:
Andet:
På papir:
Note:
Litteratur
Data Recognition Corporation 2017,
2016 LEAP ELA and Mathematics Operational Technical
Report.
Louisiana Department of Education.
Louisiana State Dept, o.E. 2012,
LEAP Assessment Guide-Revised. Grade 4: English Lan-
guage Arts, Mathematics, Science, Social Studies. Louisiana Department of Education.
115
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0116.png
Alle Teller!
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Alle Teller!
Norge
Offentlig:
Privat:
Forskningsinstitution:
At kortlægge børns talopfattelse og -forståelse
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: 1.-10. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Cawthorn, J.C. 2017,
The Analysis of the Relationship of Variables and the MKAS[superscript
2] Assessment
(Doctoral dissertation). Mississippi: Delta State University.
Mississippi Department of Education 2014,
MKAS
2
3rd Grade Reading Summative Assess-
ment
Tilgængelig på: https://www.forest.k12.ms.us/pdfs/MKAS2_3rd_Grade_Read-
ing_Sample_Item_Booklet.pdf. Besøgt d. 18-09-2019.
116
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0117.png
Sætningslæse-prøverne (SL-prøverne)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Sætningslæse-prøverne (SL-prøverne)
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes sætningslæseevner og læseudvikling med henblik på planlægning af
undervisningen, herunder også undervisningsdifferentiering og henvisning til
specialundervisning
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Anvendelse:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 1.-5. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: SL60 har 60 spm., SL40 har 40
spm.
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 15 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Nielsen, J.C., Poulsen, A., Søegård, A. & Kreiner, S. (Uden år, oprindelig cop. 1986), SL60
OG SL40. Sætningslæseprøver: Prøver til vurdering af mindre skolebørns læseevner og -
udvikling, Hogrefe, Virum.
117
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0118.png
Waterford Assessment of Core Skills
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Waterford Assessment of Core Skills
USA
Offentlig:
Privat:
Forskningsinstitution:
At vurdere tidlige udfordringer med sprog og "Skriftsprogskyndighed" (Literacy)”
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Sprog, læsedygtighed
Delskalaer:
Ja
Alder/klassetrin: Pre-kindergarten-grade 2
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Ikke en erstatning for de obligatoriske No Child Left Behind (NCLB)-relaterede tests fra grade 3,
men kan bruges til tidligt at opdage elever med udfordringer.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: over 2.000 items i
spørgsmålsbanken
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 20 min. som standard, men kan
fastsættes af læreren til 12-30 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Shamir, H. 2018, Assessing Reading in Young Learners: Using a Computerized Adaptive
Reading Test for Pre-Kindergarten through Second Grade,
Journal of Educational Multi-
media and Hypermedia,
vol. 27, no. 4, pp. 507-527.
Tirenin,
Waterford Assessments of Core Skills.
Tilgængelig på: https://www.michaelti-
renin.com/waterford-assessments-of-core-skills .Besøgt d. 18-09-2019.
118
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0119.png
Læringsstøttande prøver
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Læringsstøttande prøver
Norge
Offentlig:
Privat:
Forskningsinstitution:
At teste elevernes grundlæggende færdigheder i læsning, regning og matematik for at kunne
tilrettelægge undervisningen optimalt
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Population: Alle skolebørn (elever med ret til
specialundervisning eller særlig sproglæring
kan fritages)
Fag: Læsning, regning
Delskalaer:
Ja
Alder/klassetrin: Alle klassetrin
Emne:
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Varierer for hver test
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Varierer for hver test
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Utdanningsdirektoratet 2019,
Læringsstøttande prøver.
Tilgængelig på:
https://www.udir.no/eksamen-og-prover/prover/laringsstottande-prover/. Besøgt d. 18-09-
2019.
119
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0120.png
Seria-Think Instrument
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Seria-Think Instrument
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle basale matematikfærdigheder på en praktisk måde for elever med udfordringer i
matematik
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: 2. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Testen er udviklet til forskning, og ovenstående er baseret på en forskningsartikel, men det er
uvist, om den også sættes i brug efterfølgende.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Sessioner à 20-30 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Bosma, T. & Resing, W.C.M. 2010, "Teacher's appraisal of dynamic assessment outcomes:
Recommendations for weak mathematics-performers",
Journal of Cognitive Education
and Psychology,
vol. 9, no. 2, pp. 91-115.
120
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0121.png
Mississippi K-3 Assessment Support System (MKAS
2
)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Mississippi K-3 Assessment Support System (MKAS
2
)
USA/Mississippi
Offentlig:
Privat:
Forskningsinstitution:
At sikre, at alle grade 3-elever har tilstrækkelige læsefærdigheder til at kunne rykke op til næste
klassetrin.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle grade 3-elever i staten
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 3
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Mississippi bruger Renaissance Learning STAR (se evt. ovenfor) som screeningsværktøj, og
MKAS
2
er derfor Testdesignet til at ligne STAR, for at eleverne er bekendte med testformen. De
to tests korrelerer stærkt med hinanden.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 50
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Maks. 4,5 min. pr. spørgsmål
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Cawthorn, J.C. 2017,
The Analysis of the Relationship of Variables and the MKAS[superscript
2] Assessment
(Doctoral dissertation). Mississippi: Delta State University.
Teknisk rapport: https://www.forest.k12.ms.us/MKAS2%203rd%20Grade%20Read-
ing%20Sample%20Item%20Booklet.pdf
121
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0122.png
The AIMS-web R-Maze
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
The AIMS-web R-Maze
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle, monitorere og screene elevernes læsefærdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Artiklen undersøger grade 8-
elever
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 3 min. pr. tekstafsnit
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Conoyer, S.J., Lembke, E.S., Hosp, J.L., Espin, C.A., Hosp, M.K. & Poch, A.L. 2017, "Getting
More from Your Maze: Examining Differences in Distractors",
Reading & Writing Quarterly,
vol. 33, no. 2, pp. 141-154.
122
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0123.png
Observation Survey of Early Literacy Achievement (OSELA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Observation Survey of Early Literacy Achievement (OSELA)
USA
Offentlig:
Privat:
Forskningsinstitution:
At screene for elever med risiko for læsevanskeligheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 1
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 20-45 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
D'Agostino 2012, “Technical Review Committee Confirms Highest NCRTI Ratings for Obser-
vation Survey of Early Literacy Achievement”.
Journal of Reading Recovery,
Spring,
pp.53-56.
D'Agostino, J.V., Rodgers, E. & Mauck, S. 2018, "Addressing Inadequacies of the Observation
Survey of Early Literacy Achievement",
Reading Research Quarterly,
vol. 53, no. 1, pp. 51-
69.
123
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0124.png
EVALD – Evaluering af Læseforståelse og Delfærdigheder
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
EVALD– Evaluering af Læseforståelse og Delfærdigheder
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At afdække elevernes læseforståelse af fag- og skønlitterære tekster.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 3.-6. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Maks. 90 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Klint Petersen, D. & Rønberg, L. 2019,
EVALD - Evaluering af Læseforståelse og Delfærdig-
heder.
København: Dansk Psykologisk Forlag.
124
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0125.png
Canadian Test of Basic Skills (CTBS)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Canadian Test of Basic Skills (CTBS)
Canada
Offentlig:
Privat:
Forskningsinstitution:
At afdække elevernes faglige præstationer som afslutning på skoleforløbet.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Elever, der søger ind på
'avancerede programmer'
Fag: Læsning, matematik
Delskalaer:
Ja
Alder/klassetrin: High School Sophmore
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Kwiatkowska-White, B., Kirby, J.R. & Lee, E.A. 2016, "A Longitudinal Study of Reading Com-
prehension Achievement from Grades 3 to 10: Investigating Models of Stability, Cumula-
tive Growth, and Compensation",
Journal of Psychoeducational Assessment,
vol. 34, no.
2, pp. 153-165.
125
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0126.png
Heidelberger Rechentest
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Heidelberger Rechentest
Tyskland
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elvernes matematiske kompetencer og screene for elever med
indlæringsvanskeligheder i matematik.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Indskolingen
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 343
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 24 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Georges, C., Hoffmann, D. & Schiltz, C. 2017, "Mathematical abilities in elementary school: Do
they relate to number–space associations?"
Journal of experimental child psychology,
vol.
161, pp. 126-147.
126
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0127.png
Pennsylvania System fo School Assessment (PSSA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Pennsylvania System fo School Assessment (PSSA)
USA/Pennsylvania
Offentlig:
Privat:
Forskningsinstitution:
At producere estimater af performance på skoleniveau og vurdere elevernes niveau ift. statsligt
fastsatte læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever i staten
Fag: Læsning, skrivning, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 56-58 MC, 3-6
open-ended
(kun
læsning)
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 60 min. pr. del
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Data Recognition Corporation 2018,
2018 Pennsylvania system of school assessment tech-
nical report. Mathematics, English language arts, and science.
Pennsylvania Department
of Education.
Landman, K.E. 2015,
Reading achievement in high-stakes testing: Patterns and predictability
across time
(Doctoral dissertation). Pennsylvania: Bryn Mawr College.
127
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0128.png
New York State Math Test (NYS Math Test)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
New York State Math Test (NYS Math Test)
New York
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes færdigheder og viden og efterfølgende anvende resultatet til at tilrettelægge
elevens fremtidige mål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever i staten
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Ubegrænset
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
McKane, P. 2011,
Using VoiceThread for Communication in Mathematics Writing.
New York:
New York Institute of Technology.
NYC, Department of Education,
NY State Math Test.
Tilgængelig på:
https://www.schools.nyc.gov/school-life/learning/testing/ny-state-math. Besøgt d. 18-09-
2019.
The University of the State New York 2017,
New York State Testing Program 2017: English
Language Arts and Mathematics Grades 3–8. Technical Report.
Questar Assessment
Inc.
128
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0129.png
Udredning af læseforståelse (ULF)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Udredning af læseforståelse (ULF)
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At udrede elevers individuelle vanskeligheder med læseforståelse.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Børn "i og omkring" 3. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Mikkelsen, C. & Wessman, L. 2017,
ULF: Udredning af Læseforståelse.
Virum: Hogrefe.
129
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0130.png
Group Reading Assessment & Diagnostic Evaluation (GRADE) Test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Group Reading Assessment & Diagnostic Evaluation (GRADE) Test
USA
Offentlig:
Privat:
Forskningsinstitution:
At teste elevernes generelle læsefærdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 50-90 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Mokhtari, K. & Velten, J. 2015, "Strengthening Academic Vocabulary with Word Generation®
Helps Sixth-Grade Students Improve Reading Comprehension",
Middle Grades Research
Journal,
vol. 10, no. 3, pp. 23-42.
Pearson,
Group Reading Assessment & Diagnostic Evaluation.
Tilgængelig på:
https://www.pearsonassessments.com/store/usassessments/en/Store/Professional-As-
sessments/Academic-Learning/Reading/Group-Reading-Assessment-%26-Diagnostic-
Evaluation/p/100000646.html?tab=product-details. Besøgt d. 18-09-2019.
130
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0131.png
Skriftsproglig udvikling
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Skriftsproglig udvikling
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes skriftsproglige udvikling.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Dansk
Delskalaer:
Ja
Alder/klassetrin: 0.-8. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Varierer for hver test
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Varierer for hver test
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Møller, L. & Juul, H.
Skriftsproglig udvikling: Læse- og staveprøver til 0.-8. klasse.
Virum: Ho-
grefe.
131
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0132.png
Comprehensive Test of Phonological Processing (CTOPP-2)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Comprehensive Test of Phonological Processing (CTOPP-2)
USA
Offentlig:
Privat:
Forskningsinstitution:
Diagnostisk at teste elevernes evne til at forstå lyde i ord.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Rettet mod børn, som formodes at
have problemer med lyde i ord
Fag: Læsning (fonologisk)
Delskalaer:
Ja
Alder/klassetrin: Alle aldersgrupper
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 40 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019.
Pearson,
Comprehensive Test of Phonological Processing - Second Edition (CTOPP-2).
Til-
gængelig på: https://www.pearsonclinical.co.uk/AlliedHealth/PaediatricAssessments/Pho-
nologicalAwareness/ctopp-2/comprehensive-test-of-phonological-processing-second-edi-
tion.aspx. Besøgt d. 18-09-2019.
132
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0133.png
Test of Early Reading Ability (TERA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Test of Early Reading Ability (TERA)
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle læsefærdigheder hos de mindste børn.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Preschool-grade 3
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Der findes en lang række af disse TERA-tests, den nyeste er TERA-4 fra 2017.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 30 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019.
WPS,
(TERA-4) Test of Early Reading Ability, Fourth Edition”
Tilgængelig på:
https://www.wpspublish.com/store/p/3419/tera-4-test-of-early-reading-ability-fourth-edi-
tion. Besøgt d. 18-09-2019.
133
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0134.png
KeyMath-3 Diagnostic Assessment
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
KeyMath-3 Diagnostic Assessment
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle centrale matematiske færdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Den tekniske rapport er ikke frit tilgængeligt online.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 372
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 30-90 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019
Pearson,
KeyMath-3 Diagnostic Assessment.
Tilgængelig på: https://www.pearsonasses-
sments.com/store/usassessments/en/Store/Professional-Assessments/Academic-Lear-
ning/Math/KeyMath-3-Diagnostic-Assessment/p/100000649.html. Besøgt d. 18-09-2019.
134
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0135.png
Test of Mathemathical Abilities (TOMA-3)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Test of Mathemathical Abilities (TOMA-3)
USA
Offentlig:
Privat:
Forskningsinstitution:
At identificere, beskrive og kvantificere elevernes udfordringer i matematik.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever i staten
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Fra 8 år og op
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 20
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 60-90 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Brown, V., Cronin, M., & Bryant, D. 2012,
Test of Mathematical Abilities – Third Edition
(TOMA-3).
Tilgængelig på: http://www.proedinc.com/Downloads/14210TOMA-3WhitePa-
per.pdf. Besøgt d. 18-09-2019.
Patino, E. 2019,
Types of tests for reading, writing and math at a glance.
Tilgængelig på:
https://www.understood.org/en/school-learning/evaluations/types-of-tests/types-of-tests-
for-reading-writing-and-math. Besøgt d. 18-09-2019.
135
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0136.png
Independent Reading Level Assessment (IRLA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Independent Reading Level Assessment (IRLA)
USA
Offentlig:
Privat:
Forskningsinstitution:
At screene for læsedygtighed ift. fastsatte læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Pre-kindergarten-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 10-15 min. pr. elev
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Griswold & Bunch 2014,
A Study of the Independent Reading Level Assessment Framework.
Measurement Incorporate, MI.
Ralston, N.C., Waggoner, J.M., Tarasawa, B. & Jackson, A. 2016, "Concurrent Validity of the
Independent Reading Level Assessment Framework and a State Assessment",
Journal of
At-Risk Issues,
vol. 19, no. 2, pp. 1-8.
136
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0137.png
Consortium on Reading Excellence-Phonics Survey (CORE-PS)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Consortium on Reading Excellence-Phonics Survey (CORE-PS)
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle folkeskoleelevers fonetiske kendskab.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: N/A
Fag: Sprog (fonologisk)
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Sammenlignes med DIBELS. Den tekniske rapport er ikke frit tilgængelig online.
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 34
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 10-15 min. pr. elev
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Reutzel, D.R., Brandt, L., Fawson, P.C. & Jones, C.D. 2014, "Exploration of the Consortium on
Reading Excellence Phonics Survey",
Elementary School Journal,
vol. 115, no. 1, pp. 49-
72.
137
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0138.png
Ordstillelæsningsprøverne
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Ordstillelæsningsprøverne
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At vurdere (begynder)læsefærdigheder hos eleven.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 1.-2. og 2.-3. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Hhv. 64 og 120
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 10-15 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Andet: Prøveresultaterne beskrives i et kategorisystem, der bygger på læsehastighed og
rigtighedspct./forståelse.
Note:
Litteratur
Søegård, A., Hesselholdt, S., Kreiner, S., Poulsen, A. & Nielsen, J.C. (cop. 1983),
Ordstille-
læsningsprøverne OS64 & OS120 - et prøvemateriale til beskrivelse af børns begyndende
løseudvikling.
Virum: Hogrefe.
138
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0139.png
Touchstone's Degrees of Reading Power Test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Touchstone's Degrees of Reading Power Test
USA
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes læsefærdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 45-60 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Paulson & Henry (2002): "Does the Degrees of Reading Power assessment reflect the read-
ing process? An eye-movement examination",
Journal of Adolescent & Adult Literacy,
Vol. 46, no. 3, pp. 234-244
Wilson, M., Hallam, P.J., Pecheone, R. & Moss, P.A. 2014, "Evaluating the Validity of Portfo-
lio Assessments for Licensure Decisions",
Education Policy Analysis Archives,
vol. 22,
no. 6, pp. 1-30.
139
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0140.png
Florida Standards Assessment (FSA)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Florida Standards Assessment (FSA)
USA/Florida
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes færdigheder inden for læsning, stavning og matematik ift. de statsligt fastsatte
læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Offentlige grundskoler i staten
Alder/klassetrin: Grade 3-10
Fag: English Language Arts (ELA), matematik, algebra, geometri
Delskalaer:
Ja
Nej
Testprincip
Indhold:
Antal Items: 56-66
Tidsramme: Over to dage, med to sessioner à
80-90 min. til English Language Arts-læsning,
to sessioner à 80 eller tre sessioner à 60 min.
til matematik og én 120 min. session til ELA-
stavning
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Forældre:
Andet:
Elev:
Lærer:
Myndighed:
Karaktergivning:
Kriteriebaseret:
Andet:
Normbaseret:
Skaleret score:
Visualisering:
Online:
Andet:
På papir:
Note:
Litteratur
Bedasse, M.M. 2017,
The Effect of Teacher Characteristics on Student Achievement in Low
Performing Schools
(Doctoral dissertation). Florida: University of Florida.
Florida Standards Assessments, n.d.,
Florida Standards Assessments 2017–2018. Volume 4
Evidence of Reliability and Validity.
Florida Department of Education.
FLDOE.org,
Florida Standards Assessments.
Tilgængelig på: http://www.fldoe.org/accounta-
bility/assessments/k-12-student-assessment/fsa.stml. Besøgt d. 18-09-2019.
140
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0141.png
Make-A-Dice
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Make-A-Dice
USA
Offentlig:
Privat:
Forskningsinstitution:
En vurdering af elevernes rumlige og matematiske tankegang.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Alle aldersgrupper
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: I artiklen bruger der 8 items til
børn (grade 3-6) og 11 items til voksne
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 6 min. til 8 item-sessionen
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Burte, H., Gardony, A.L., Hutton, A. & Taylor, H.A. 2019, "Make-A-Dice Test: Assessing the
intersection of mathematical and spatial thinking",
Behavior Research Methods,
vol. 51, no.
2, pp. 602-638.
141
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0142.png
Virginia Standards of Learning Assessment
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Virginia Standards of Learning Assessment
USA/Virginia
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes niveau ift. statsligt fastsatte læringsmål og efterfølgende kunne
offentliggøre, om elever på kollektivt niveau lever op til disse.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Folkeskoleelever
Fag: Matematik, læsning
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 35-50
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Varierer for hver test
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Chennis, S.T. 2018,
The Impact of Traditional and Departmentalized Classroom Instructional
Settings on Fifth Grade Students' Reading Achievement
(Doctoral dissertation). Virginia:
Liberty University.
Virginia.org,
Standards of Learning Assessments. Technical Report, 2013-2014 Adm. Cycle.
Virginia.org,
Standards of Learning (SOL) & Testing.
Tilgængelig på: http://www.doe.virgi-
nia.gov/testing/index.shtml. Besøgt d. 18-09-2019.
142
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0143.png
Mathematical School Readiness (MSR) Test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Mathematical School Readiness (MSR) Test
Belgien
Offentlig:
Privat:
Forskningsinstitution:
At måle matematikniveauet hos børn, der lige er begyndt i skole.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 1 (6-7 år)
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Fem opgaver
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Ca. 20 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Mejias, S., Muller, C. & Schiltz, C. 2019, "Assessing Mathematical School Readiness",
Fron-
tiers in Psychology,
vol. 10, article 1173, pp. 1-11.
143
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0144.png
Process-Oriented Syntactic Skills Test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Process-Oriented Syntactic Skills Test
Tyskland
Offentlig:
Privat:
Forskningsinstitution:
At måle elevernes syntaktiske sproglige færdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Sprog
Delskalaer:
Ja
Alder/klassetrin: Grade 1-4
Nej
Testprincip
Indhold:
Antal Items: 38 skrevne sætninger (visuel), 38
talte sætninger (auditory). Halvdelen af hver
(2x19) er grammatisk forkerte, halvdelen er
grammatisk rigtige
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Forældre:
Andet:
Elev:
Lærer:
Myndighed:
Karaktergivning:
Kriteriebaseret:
Andet:
Normbaseret:
Skaleret score:
Visualisering:
Online:
Andet:
På papir:
Note:
Litteratur
Schindler, J., Richter, T., Isberner, M., Naumann, J. & Neeb, Y. 2018, "Construct Validity of a
Process-Oriented Test Assessing Syntactic Skills in German Primary Schoolchildren",
Lan-
guage Assessment Quarterly,
vol. 15, no. 2, pp. 183-203.
144
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0145.png
Smarter Balanced Assessment Consortium
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Smarter Balanced Assessment Consortium
USA
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes evner i sprog og matematik.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Sprog, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
CTB/McGraw-Hill 2013, ”Smarter Balanced Assessment Consortium: Technical Report Initial
Achievement Level Descriptors”.
Smarter Balanced Asses Consortium.
Herman, J.L., La, T.M., Wang, J. & National Center for Research on Evaluation, Standards,
and, Student Testing 2015, “On the Road to Assessing Deeper Learning: What Direction
Do Test Blueprints Provide?” CRESST Report 849, National Center for Research on Eval-
uation, Standards, and Student Testing (CRESST).
145
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0146.png
GL Assessment: Progress in English Test
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
GL Assessment: Progress in English Test
UK
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes engelskfærdigheder og læseforståelse.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Engelsk
Delskalaer:
Ja
Alder/klassetrin: 5-14 år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 60-75 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
GL Assessment,
Progress Test in Enlish (PTE).
Tilgængelig via: https://www.gl-asses-
sment.co.uk/products/progress-test-in-english-pte/. Besøgt d. 18-09-2019.
Torgerson, D., Torgerson, C., Mitchell, N., Buckley, H., Ainsworth, H., Heaps, C., Jefferson, L.,
Education, E.F., University, o.Y. & Durham University (United Kingdom) 2014,
Grammar
for Writing: Evaluation Report and Executive Summary,
Education Endowment Foundation.
146
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0147.png
Ordlæseprøve
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Ordlæseprøve
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevers skriftsproglige udvikling.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever
Fag: Læsning
Delskalaer:
Ja
Alder/klassetrin: 0.-8. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Hogrefe,
Skriftsproglig udvikling.
Tilgængelig via: https://www.hogrefe.dk/shop/skriftsproglig-
udvikling.html. Besøgt d. 25-09-2019.
147
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0148.png
ST (stavning) prøver
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
ST (Stavning) prøver
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes stavefærdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Stavning
Delskalaer:
Ja
Alder/klassetrin: 2.-9. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 45 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Hogrefe,
Pædagogisk analyse af stavning.
Tilgængelig via:
https://www.hogrefe.dk/shop/paedagogisk-analyse-af-stavning.html. Besøgt d. 25-09-
2019.
Børne- og Undervisningsministeriet, Styrelsen for IT og læring,
Materialeplatformen
®
ST 2-9.
Tilgængelig via: https://materialeplatform.emu.dk/materialer/bogkort/27390063. Besøgt
d. 25-09-2019
148
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0149.png
MAT (Matematik) prøver
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
MAT (Matematik) prøver
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At afdække elevernes matematikfærdigheder diagnostisk inden for forskellige hovedområder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Matematik
Delskalaer:
Ja
Alder/klassetrin: 1.-9. klasse
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Andet: Rapport, der beskriver resultater på både klasse- og individniveau.
Note:
Litteratur
Hogrefe,
Pædagogisk analyse af matematik.
Tilgængelig via: https://www.ho-
grefe.dk/shop/paedagogisk-analyse-af-matematik.html. Besøgt d. 25-09-2019.
Børne- og Undervisningsministeriet, Styrelsen for IT og læring,
Materialeplatformen
®
Mat 1-9.
Tilgængelig via: https://materialeplatform.emu.dk/materialer/bogkort/27358385. Besøgt
d. 25-09-2019
149
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0150.png
Gyldendals webprøver
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Gyldendals webprøver
Danmark
Offentlig:
Privat:
Forskningsinstitution:
At forberede eleverne til form og opgavetyper i folkeskolens afgangsprøver.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Dansk, matematik
Delskalaer:
Ja
Alder/klassetrin: 4.-9. klasse (varirerer med
fag)
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Varierer for hver test
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Varierer for hver test
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Gyldendal,
Webprøver.
Tilgængelig via: http://webprøver.dk/. Besøgt d. 25-09-2019.
150
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0151.png
The California Assessment of Student Performance and Progress
(CAASPP)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
The California Assessment of Student Performance and Progress (CAASPP)
USA/Californien
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes viden og færdigheder ift. de statsligt fastsatte læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Population: Alle elever i staten, undtagen
elever, som modtager specialundervisning
eller har gået i amerikansk skole i mindre end
et år
Fag: English Language Arts (ELA), matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-8 og 11
Emne:
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
CAASPP (California Department of Education Development and Administration Division) 2018,
California Assessment of Student Performance and Progress Smarter Balanced Technical
Report 2016–17 Administration.
Education Testing Service.
151
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0152.png
Ohio Standardized Tests (OST)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Ohio standardized Tests (OST)
USA/Ohio
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes viden og færdigheder ift. de statsligt fastsatte læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: English Language Arts (ELA), matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-High School
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
Testen er adaptiv i onlineversion og lineær i papirversion
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Varierer for hver test
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 180-210 min. pr. fag
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
AIR (American Institutes for Research) 2017,
Annual Technical Report – Ohio’s State Tests in
English Language Arts, Mathematics, Science, and Social Studies, 2015-2016 School
Year.
Ohio Department of Education.
Peugeot, M.A. 2017,
Impact of Academic and Nonacademic Support Structures on Third Grade
Reading Achievement
(Doctoral dissertation). Ohio: University of Findlay.
152
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0153.png
English Language Proficiency Assessments for California (ELPAC)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
English Language Proficiency Assessments for California (ELPAC)
USA/Californien
Offentlig:
Privat:
Forskningsinstitution:
At vurdere engelskniveauet for tosprogede elever.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Obligatorisk for elever, der kke har
engelsk som modersmål
Fag: Engelsk
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: 32-70 afhængig af test
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
ELPAC,
News and Tips for the ELPAC Administration.
Tilgængelig via:
https://www.elpac.org/. Besøgt d. 25-09-2019.
ELPAC,
Test Administration.
Tilgængelig via: https://www.elpac.org/test-administration/.
Besøgt d. 25-09-2019.
153
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0154.png
English Language Proficiency Assessment for the 21st Century
(ELPA21)
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
English Language Proficiency Assessment for the 21st Century (ELPA21)
USA
Offentlig:
Privat:
Forskningsinstitution:
At vurdere engelskniveauet for tosprogede elever ift. statslige læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population:
Fag: Engelsk
Delskalaer:
Ja
Alder/klassetrin: Kindergarden-grade 12
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☒
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme:
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
The Regents of the University of California 2016,
ELPA21 Standard Setting Technical Report.
Pacific Metrics og UCLA Cresst.
154
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0155.png
Georgia Milestones Assesment System
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Georgia Milestones Assesment System
USA/Georgia
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes viden og færdigheder ift. de statslige læringsmål.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle elever i staten
Fag: Engelsk, matematik
Delskalaer:
Ja
Alder/klassetrin: Grade 3-High School
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet:
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items: Varierer på tværs af både grades
og fag
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: Varierer over grades og fag
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Georgia Milestones Assessment System,
Welcome to Experience Online Testing Georgia.
Tilgængelig via: http://www.gaexperienceonline.com/. Besøgt d. 25-09-2019.
Crawford County Schools,
Georgia Milestones Assessment System.
Tilgængelig via:
https://www.crawfordschools.org/apps/pages/index.jsp?uREC_ID=1240618&type=d&pRE
C_ID=1469547. Besøgt d. 25-09-2019.
155
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0156.png
Peabody picture vocabulary test – V
Testbeskrivelse
Navn:
Land/Stat:
Testudvikler:
Formål:
Anvendelse:
Peabody picture vocabulary test – V
USA
Offentlig:
Privat:
Forskningsinstitution:
At vurdere elevernes receptive sprogforståelse og ordforråd samt deres verbale færdigheder.
Pædagogisk værktøj:
Andet:
Styringsredskab:
Screeningsværktøj:
Målgruppe:
Emne:
Population: Alle skolebørn
Fag: Engelsk
Delskalaer:
Ja
Alder/klassetrin: 2,5-90+ år
Nej
Testprincip
Indhold:
IRT:
Testdesign:
Itemdesign:
Bedømmelse:
Teknisk rapport:
Afrapportering
Modtager:
Forældre:
Andet:
Karaktergivning:
Kriteriebaseret:
Andet: Point
Visualisering:
Online:
Andet:
Note:
På papir:
Normbaseret:
Skaleret score:
Elev:
Lærer:
Myndighed:
Antal Items:
Ja☐
Adaptiv:
Åbne:
Manuelt:
Intern:
Tidsramme: 10-15 min.
Nej:
Lineær:
Lukkede:
Computer:
Ekstern:
Litteratur
Kearns, G. & Biemiller, A. 2010, "Two-Questions Vocabulary Assessment: Developing a New
Method for Group Testing in Kindergarten through Second Grade",
Journal of Education,
vol. 190, no. 1, pp. 31-41.
Young-Suk Kim, Petscher, Y., Schatschneider, C. & Foorman, B. 2010, "Does Growth Rate in
Oral Reading Fluency Matter in Predicting Reading Comprehension Achievement?",
Jour-
nal of Educational Psychology,
vol. 102, no. 3, pp. 652-667.
156
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0157.png
Forældede test
Testnavn
Arizonas Instrument to Measure
Standards (Reading AIMS)
Referencer
Allen, C.E. 2018,
Measuring First Graders' Growth on Word Identification Fluency:
A Prognosis for Later Performance?
(Doctoral dissertation). Arizona: Univer-
sity of Arizona.
Herrington, T.M. 2018,
Arizona's Move on When Reading: Was Earlier Identification
of Those Likely to Be Retained Possible?
(Doctoral dissertation). Arizona:
Northern Arizona University.
California Standards Test
Awabdy, G.W. 2013,
Background knowledge and its effect on standardized reading
comprehension test performance
(Doctoral dissertation). Berkeley: University
of California.
Diamond, E., Furlong, M.J. & Quirk, M. 2016, "Academically Resilient Latino Ele-
mentary Students Bridging the Achievement Gap",
Contemporary School
Psychology,
vol. 20, no. 2, pp. 160-169.
Fast, L.A., Lewis, J.L., Bryant, M.J., Bocian, K.A., Cardullo, R.A., Rettig, M. & Ham-
mond, K.A. 2010, "Does math self-efficacy mediate the effect of the per-
ceived classroom environment on standardized math test performance?",
Journal of educational psychology,
vol. 102, no. 3, pp. 729-740.
Florida Comprehensive Assess-
ment Test (FCAT)
Bedasse, M.M. 2017,
The Effect of Teacher Characteristics on Student Achieve-
ment in Low Performing Schools
(Doctoral dissertation). Florida: University of
Florida.
Bennett, S.V., Calderone, C., Dedrick, R.F. & Gunn, A.A. 2015, ""Do I Have to
Leave?" Beyond Linear Text: Struggling Readers' Motivation with an Innova-
tive Musical Program",
Reading Improvement,
vol. 52, no. 2, pp. 51-60.
Buck, J., Torgesen, J. & Florida State University, Florida Center for,Reading Re-
search 2018,
The Relationship between Performance on a Measure of Oral
Reading Fluency and Performance on the Florida Comprehensive Assess-
ment Test. FCRR Technical Report #1,
Florida Center for Reading Research.
Foorman, B.R., Petscher, Y., Lefsky, E.B. & Toste, J.R. 2010, "Reading First in
Florida: Five Years of Improvement",
Journal of Literacy Research,
vol. 42,
no. 1, pp. 71-93.
Little, C.W. & Hart, S.A. 2016, "Examining the genetic and environmental associa-
tions among spelling, reading fluency, reading comprehension and a high
stakes reading test in a combined sample of third and fourth grade students",
Learning and Individual Differences,
vol. 45, pp. 25-32.
Reutzel, D.R., Petscher, Y. & Spichtig, A.N. 2012, "Exploring the Value Added of a
Guided, Silent Reading Intervention: Effects on Struggling Third-Grade
Readers' Achievement",
Journal of Educational Research,
vol. 105, no. 6, pp.
404-415.
Stanley, N. & Stanley, L. 2011, "Predicting FCAT reading scores using the Read-
ing-Level Indicator",
Reading Psychology,
vol. 32, no. 2, pp. 99-112.
Vernaza, N.A. 2012, "Teachers' Perceptions of High-Stakes Accountability in Flori-
da's Title I Elementary Schools",
Current Issues in Education,
vol. 15, no. 1.
Wingfield, R.J., Graziano, P.A. & McNamara, Joseph P. H., Janicke,David M. 2011,
"Is There a Relationship between Body Mass Index, Fitness, and Academic
Performance? Mixed Results from Students in a Southeastern United States
Elementary School",
Current Issues in Education,
vol. 14, no. 2., pp. 1-10.
Iowa Test of Basic Skills (ITBS)
Conoyer, S.J., Foegen, A. & Lembke, E.S. 2016, "Early Numeracy Indicators",
Re-
medial & Special Education,
vol. 37, no. 3, pp. 159-171.
McGee, D., Brewer, M., Hodgson, T., Richardson, P., Gonulates, F. & Weinel, R.
2017, "A Districtwide Study of Automaticity When Included in Concept-Based
Elementary School Mathematics Instruction",
School Science & Mathematics,
vol. 117, no. 6, pp. 259-268.
157
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0158.png
Testnavn
Peabody Picture Vocabulary Test-
III (PPVT-III)
Referencer
Kearns, G. & Biemiller, A. 2010, "Two-Questions Vocabulary Assessment: Devel-
oping a New Method for Group Testing in Kindergarten through Second
Grade",
Journal of Education,
vol. 190, no. 1, pp. 31-41.
Young-Suk Kim, Petscher, Y., Schatschneider, C. & Foorman, B. 2010, "Does
Growth Rate in Oral Reading Fluency Matter in Predicting Reading Compre-
hension Achievement?",
Journal of educational psychology,
vol. 102, no. 3,
pp. 652-667.
Reading Criterion-References
Competency Test
Alabama Reading and Mathemat-
ics Test +
Fincher, M.L. 2014,
Investigating the effects of a read-aloud alteration on the third-
grade reading criterion-referenced competency test (CRCT) for students with
disabilities
(Doctoral dissertation). Georgia: Georgia State University.
Hardy Palmer, B.A. 2015,
A comparative analysis between accelerated reader
scores and student performance on the Alabama reading and mathematics
test+ in Central Alabama
(Doctoral dissertation) Minnesota: Capella Univer-
sity.
Clark, D.M., Slate, J.R., Combs, J.P. & Moore, G.W. 2013, "Math and Reading Dif-
ferences between 6-8 and K-8 Grade Span Configurations: A Multiyear,
Statewide Analysis",
Current Issues in Education,
vol. 16, no. 2, pp. 1-16.
Lawon, M.A. 2017,
The Relationship between Language Literacy and ELL Student
Academic Performance in Mathematics.
Heritage University.
McElvain, C.M. 2015, "The Bridge Project: Connecting Home, School, and Commu-
nity for Mexican Immigrant Children",
Journal of Latinos and Education,
vol.
14, no. 3, pp. 153-170.
Peugeot, M.A. 2017,
Impact of Academic and Nonacademic Support Structures on
Third Grade Reading Achievement
(Doctoral dissertation). Ohio: University of
Findlay.
Texas Assessment of Knowledge
and Skills (TAKS) Reading and
Math assessments
The Washington English Language
Proficiency Assessment (WELPA)
California English Language Devel-
opment Test
Ohio Achievement Assessment
158
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0159.png
5
Design og metode
I det følgende kapitel er testkortlægningens design og metode beskrevet.
For at kortlægge, hvilke test der findes og anvendes rundt om i verden, foretages en testkort-
lægning med udgangspunkt i en systematisk litteratursøgning foretaget af VIVEs bibliotek.
Den systematiske litteratursøgning er foretaget igennem følgende fem trin inspireret af Gough
(2004). Indledende præcisering af undersøgelsesspørgsmålet, herunder specificering af inklu-
sions- og eksklusionskriterier såsom årstal, geografi, etc.
1. Udarbejdelse af søgeprotokol
2. Systematisk søgning i elektroniske databaser og på hjemmesider
3. Identifikation af relevante studier, der besvarer undersøgelsesspørgsmålet og opfylder
inklusionskriterierne. Disse anvendes derefter til at identificere relevante test.
4. Beskrivelse af hver test på en række dimensioner (Indhold, princip, afrapportering).
5.1
Undersøgelsesspørgsmål, inklusions- og eksklusionskriterier
Formålet med litteratursøgningen er at belyse, hvilke andre test der er sammenlignelige med
de nationale test. Første skridt var at identificere testlandskabet i lande, hvis uddannelsessy-
stem til en hvis grad kan sammenlignes med det danske.
5.1.1
Inklusionskriterier
Følgende kriterier er anvendt som inklusionskriterier.
Søgningen er begrænset til at omfatte studier af psykonometriske og pædagogiske test i grund-
skolen i de nordiske lande, Tyskland, Belgien, Storbritannien, Frankrig, Holland, USA, Canada,
Australien, New Zealand, Singapore, Sydkorea, og Japan. Vi afgrænser søgeperioden til 2009-
2019, først og fremmest for at begrænse antallet af test, men også for at få relevante test.
Mange test vil fx være videreudviklinger, hvor kun de seneste udgaver er interessante for ana-
lysen. Ydermere begrænses søgningen til alene at omfatte test på nationalsprog, fx faget
dansk i Danmark, og i faget matematik. Dette valg er truffet, da dansk og matematik er de to
hovedfag i folkeskolen, og de to test, der har flest både obligatoriske og frivillige test i de danske
nationale test. Idet opgavens formål er at identificere andre test end de danske nationale test,
udelades disse.
Søgningen har inkluderet forskningsbaseret og ikke-forskningsbaseret litteratur. Idet der søges
en beskrivelse af en given test, er der ydermere foretaget en hjemmesidesøgning hos uddan-
nelsesministerier, relevante organisationer og store testudbydere. I udgangspunktet er alle stu-
dier, der omhandler test inden for ovenstående kriterier, dvs. studier, der beskriver, evaluerer
eller anvender en given test, inkluderet.
Undersøgelsesspørgsmål
Hvilke test findes, der i formål, indhold og omfang minder om de danske nationale test?
159
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0160.png
5.1.2
Eksklusionskriterier
Følgende eksklusionskriterier er anvendt til at selektere mellem relevante og ikke relevante
studier og test:
Studier publiceret før 2009
Studier, der ikke omhandler test, der tester faglighed i nationalsprog eller matematik
Studier, der ikke omhandler børn i grundskolealderen (5-16 år)
Studier, der ikke omhandler test anvendt i de nordiske lande, Tyskland, Belgien, Storbri-
tannien, Frankrig, Holland, USA, Canada, Australien, New Zealand, Singapore, Sydkorea,
og Japan
Studier, der omhandler lokale test (dvs. testene skal ikke være designet til at teste en elevs
læseforståelse på en lokal skole, men skal derimod være tiltænkt en bredere målgruppe,
såsom 6. klasses elever i Danmark)
Studier, der ser på effekten af en given test (fx hvordan en given test påvirker elevers
motivation eller lignende)
Studier, der ikke er publiceret på dansk, svensk, norsk eller engelsk
Studier, der ikke omhandler pædagogiske og psykonometriske test
Studier, der omfatter de danske nationale test.
5.2
Selektionsprocedure
Det systematiske litteraturreview blev udført i to dele, hvor del 1 bestod af en systematisk litte-
ratursøgning, og del 2, der på baggrund af del 1, identificerede alle relevante test og derefter
beskrev hver enkelt test ud fra et oversigtsskema.
Del 1 blev opdelte i to faser:
Fase 1.
Screening af potentielt relevante studier
Fase 2.
Evaluering af relevansen af disse studier i forhold til ovenstående inklusionskriterier.
Del 2 blev ligeledes opdelt i to faser og bestod i at identificere og evaluere testene på baggrund
af den selekterede litteratur i del 1:
Fase 3.
Identifikation af relevante test på baggrund af del 1
Fase 4.
Systematisk gennemgang af formål, indhold, princip og afrapportering for hver test.
Herunder tilføjelse af eventuelle nye relevante test, eksempelvis hvis en test er blevet
erstattet af en ny, samt relevant litteratur, der ikke er identificeret igennem den syste-
matiske litteratursøgning.
5.2.1
Del 1
I
fase 1
er der på baggrund af inklusions- og eksklusionskriterierne foretaget en systematisk
litteratursøgning i elektroniske databaser inden for:
Tidsbegrænsning: 2009-2019
7
Sprog: Dansk, svensk, norsk og engelsk.
Juni/juli 2019.
7
160
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0161.png
Søgningen inkluderer relaterede emneord. Databasesøgninger foretaget i:
DanBib/Netpunkt (national biblioteksbase Danmark):
(Skole? eller folkeskole? eller primary school eller elementary school) og (lem=test? eller
lem=nationale tests eller lem=læsetest? eller lem=matematiktest? eller lem=skoletest? el-
ler lem=skoleprøve? eller lem=nationale prøver eller lem=elevbedømmelser eller lem=be-
dømmelsessystemer eller lem=evalueringsværktøj eller lem=evalueringsmetode? eller
lem=elevvurdering? eller lem=læsetest? eller lem=matematiktest? eller lem=ability testing
eller lem=educational tests and measurements eller lem=national test eller lem=adaptive
comparative judgement eller lem=psychometrics) og (sp=dan eller (sp=eng eller sp=enm
eller sp=ang) eller sp=nor eller (sp=swe eller sp=sve)) og (ma=bå eller ma=dp eller ma=ap)
og år>2008
Libris (national biblioteksbase Sverige:)
#1 ÄMNE:(Nationella prov) OR ÄMNE:(Kunskapsprov) OR (ÄMNE:test? skol?), 2009-juni
2019.
#2 Elevtest* OR elevprov* OR matematiktest* OR matematikprov* OR lästest* OR läsprov*
OR skrivtest* OR skrivprov*, 2009-juni 2019.
#3 (Kunskapstest* OR kunskapsprov* OR kunskapskontroll* OR kompetenstest* OR nati-
onella prov*) grundskol*, 2009-juni 2019.
ORIA (national biblioteksbase Norge):
Emne: Elevvurderinger ELLER Tittel: Elevtest ELLER elevtester ELLER leseprøve ELLER
leseprøver ELLER lesetest ELLER lesetester ELLER matematikkprøve ELLER matema-
tikkprøver ELLER matematikktest ELLER matematikktester ELLER regneprøve ELLER
regneprøver ELLER nasjonale prøver ELLER nasjonal prøve ELLER skriveprøve ELLER
skriveprøver OG Tittel: norskfaget ELLER matematikk* ELLER regning ELLER lesing EL-
LER leseferdigheter ELLER skriving ELLER skriveferdigheter, -
Utgivelsesdato: Siste ti år:
(137),
Materialtyper: Bøker, Bokkapitler, Fagfellevurderte tidsskrift, Doktoravhandling,
Tekstressourcer.
ERIC (Ebsco):
#1 DE "Primary Education" OR DE "Elementary Education" OR DE "Elementary School
Students".
#2 DE "Reading" OR DE "Reading Comprehension" OR DE "Reading Skills" OR DE
"Reading Fluency" OR DE "Reading Ability" OR DE "Reading Achievement" OR DE "Writ-
ing Skills" OR DE "Mathematics" OR DE "Elementary School Mathematics OR DE "Math-
ematics Achievement" OR DE "Mathematics Skills".
#3 (#1 AND #2).
#4 DE "Measures (Individuals)" OR DE "Tests" OR DE "Achievement Tests" OR DE "Read-
ing Tests" OR DE "Verbal Tests" OR DE "Language Tests" OR DE "Writing Tests" OR DE
"Mathematics Tests" OR DE "National Competency Tests" OR DE "Mastery Tests" OR DE
"Standardized Tests" OR DE "Testing" OR DE "Adaptive Testing" OR DE "Testing Pro-
grams" OR Computer Assisted Testing OR DE "Individual Testing" OR DE "Timed Tests"
OR DE "Screening Tests" OR DE "Test Use" OR DE "Test Construction" OR DE "Test
161
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0162.png
Items" OR DE "Performance Tests" OR DE "Test Reliability" OR DE "Test Validity" OR
DE "Psychometrics".
#5 (#3 AND #4)
#6 Filtrering 1: #5(4.836), Limiters - Date Published: 20090101-20190631; Narrow by Lan-
guage: English, Publication Type: Tests/Questionnaires.
#7 Filtrering 2: #5(4.836), Limiters - Date Published: 20090101-20190631; Narrow by Lan-
guage: English, Publication Type: Academic journals, peer reviewed, Narrow by Subject
Geographic: MULIGE: Canada, Germany, Netherlands, USA.
#8 Filtrering 3: #5(4.836), Limiters - Date Published:
20150101-20191231,
Narrow by Sub-
ject: mathematics tests, Narrow by Subject: reading tests, Narrow by Language: English.
Academic Search Premier (Ebsco):
#1 DE "EDUCATIONAL tests & measurements" OR DE "ABILITY testing" OR DE "ACA-
DEMIC achievement testing" OR DE "MATHEMATICAL ability testing" OR DE "ACHIEVE-
MENT tests" OR DE "TEST of Word Reading Efficiency" OR DE "TEST of Written English"
OR DE "TEST design" OR DE "ITEM response theory" OR DE "PSYCHOMETRICS" OR
DE "RASCH models".
#2 (DE "SPELLING ability" OR DE "VERBAL ability" OR "MATHEMATICAL ability) AND
TI test*.
#3 (#1 OR #2).
#4 DE "SCHOOL children".
#5 (#3 AND #4): (603), Limiters - Published Date: 20090101-20191231, Narrow by Lan-
guage: English, Acad. Journals.
PsycInfo (Ebsco):
#1 DE "Elementary School Students" OR DE "Primary School Students" OR SU Primary
schools OR KW Primary school children.
#2 DE "Reading Ability" OR DE "Reading Achievement" OR DE "Reading Skills" OR DE
"Writing Skills" OR DE "Reading Comprehension" OR DE "Reading Speed" OR DE "Math-
ematics" OR DE "Mathematics Achievement".
#3 (#1 AND #2).
#4 DE "Educational Measurement" OR DE "Standardized Tests" OR DE "Testing" OR DE
"Reading Measures" OR DE "Adaptive Testing" OR DE "Item Response Theory" OR DE
"Computerized Assessment" OR DE "Achievement Measures" OR TI test*.
#5 (#3 AND #4): (824), Limiters - Published Date: 20090101-20190631; Language: Danish,
English, Norwegian, Swedish.
SocIndex (Ebsco):
#1 DE "SCHOOL children" OR DE "ELEMENTARY education" OR DE "PRIMARY educa-
tion" OR DE "Elementary School Students" OR DE "Primary School Students" OR SU Pri-
mary schools OR KW Primary school children.
#2 DE "READING" OR DE "WRITING" OR SU Reading comprehension OR SU Reading
achievement OR SU Reading ability OR KW Reading skills OR SU Mathematics OR SU
Mathematics achievement OR SU Mathematical ability in children OR SU mathematical
skills OR KW mathematical skills.
#3 (#1 AND #2).
162
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0163.png
#4 DE "TESTING" OR DE "COMPETENCY tests (Education)" OR DE "EDUCATIONAL
tests & measurements" OR DE "ABILITY testing" OR DE "ACHIEVEMENT tests" OR DE
"STANDARDIZED tests" OR DE "PSYCHOMETRICS" OR DE "ITEM response theory" OR
DE "RASCH models" OR KW adaptive testing OR SU Mathematical ability testing OR SU
Reading ability testing OR SU Comprehension testing OR TI test*.
#5 (#3 AND #5): (31), Limiters - Date of Publication: 20090101-20190731; Language: Dan-
ish, English, Norwegian, Swedish.
Web of Science (Social Science Citation Index SSCI):
((TS=test* OR TS="standardi?ed test" OR TS="ability test" OR TS="achievement test" OR
TS="Adaptive testing" OR TS="Adaptive test" OR TS="Adaptive tests" OR TS="Educa-
tional test" OR TS=Psychometric OR TS="Item response theory" OR TS="Rasch model"
OR TS="Adaptive test" OR TS="Adaptive testing" OR TS="Reading ability test" OR
TS="Mathematics ability test") AND (TS="elementary school" OR TS="elementary educa-
tion" OR TS="primary school" OR TS="primary education" OR TS="school children") AND
(TS="reading skills" OR TS="mathematical skills" OR TS="reading ability" OR TS="writing
skills" OR TS="writing ability" OR TS="mathematical ability" OR TI=Reading OR TI=Math-
ematics )) AND LANGUAGE: (English OR Danish OR Norwegian OR Swedish)
Refined by:
COUNTRIES/REGIONS: ( USA OR AUSTRIA OR ENGLAND OR NETHERLANDS OR IRELAND
OR DENMARK OR GERMANY OR LUXEMBOURG OR AUSTRALIA OR NEW ZEALAND OR CAN-
ADA OR FINLAND OR SOUTH KOREA OR BELGIUM OR FRANCE OR SCOTLAND OR SINGA-
PORE OR NORWAY OR NORTH IRELAND OR SWITZERLAND OR WALES OR SWEDEN )
, In-
dexes=SSCI, A&HCI Timespan=2009-2019.
Teacher Reference Center (Ebsco):
#1 SU standardized testing OR SU standardized tests OR SU achievement tests OR SU
achievement testing OR SU READING ability testing OR WRITING ability testing OR
MATHEMATICAL ability testing OR SU psychometrics OR SU rasch model OR SU rasch
analysis OR SU adaptive testing.
#2 SU primary school OR SU primary education OR SU elementary school OR SU ele-
mentary education OR SU school children.
#3 (#1 AND #2): (319), Limiters - Published Date: 20090101-20190731; English, Peer Re-
viewed.
Ud over en søgning i ovenstående databaser er der foretaget litteratursøgning på en række
udvalgte hjemmesider. Søgningens formål har været at afdække, om der findes anden relevant
litteratur så som tekniske rapporter og andre beskrivelser, der ikke har været i peer review og
derfor ikke bliver identificeret via søgningen i de elektroniske databaser. Der har været søgt på
følgende hjemmesider:
Danmark
Dansk Clearinghouse for Uddannelsesforskning:
http://edu.au.dk/forskning/danskclea-
ringhouseforuddannelsesforskning/udgivelser/:
Publikationer gennemset.
Dansk Psykologisk Forlag: Gennemset Psykologi, Test - https://dpf.dk/produktkategori/test
- Ingen relevante. Gennemset Pædagogik, Test og prøver - https://dpf.dk/produktkate-
gori/test-proever:
Hogrefe (forlag) -
https://www.hogrefe.dk/:
Gennemset Udgivelser (test + bøger).
163
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0164.png
DPU, Aarhus universitet:
http://edu.au.dk/forskning/publikationer/:
Publikationer gennem-
set.
Nationalt Center for Skoleforskning: http://ncs.au.dk/publikationer/: Publikationer gennem-
set.
Undervisningsministeriet:
https://uvm.dk/,
Publikationer gennemset.
Sverige
Skolinspektionen: https://www.skolinspektionen.se/sv/Beslut-och-rapporter/Publikationer/:
Publikationer Betyg och kunskapsbedömning, Grundskolan samt Publikationer, Prov och
resultat, Grundskolan gennemset.
Skolporten: https://www.skolporten.se/: Gennemset kategori: Grundskola Prov: Intet valgt.
Vetenskapliga tidsskrifter, søgt: Test.
Skolverket: https://www.skolverket.se/: Gennemset Nationella prov.
Bedömningsportalen (Skolverket): https://bp.skolverket.se/web/thv/start: Gennemset
Grundskoleutbildning, Matematik hhv. Svenska: https://bp.skolverket.se/web/thv/start.
Utbildningsdepartementet:
https://www.regeringen.se/sveriges-regering/utbildningsdepar-
tementet/.
Norge
Cappelen Damm Undervisning (forlag): https://www.cappelendammundervisning.no/: gen-
nemset Grunnskole.
Fakbogforlaget: https://www.fagbokforlaget.no/.
Institutt for lærerutdanning og skoleforskning (UiO): Publikasjoner. Gennemset TEMA:
Skole og videregående opplæring.
Lesesenteret, Universitetet i Stavanger: https://lesesenteret.uis.no/.
Matematikksenteret, NTNU Trondheim: https://www.matematikksenteret.no/: Grundskole,
Eksamen, prøver og kartlegging, Vurderingsveeerktøy for skole.
PP-tjenestens Materiellservice: https://www.materiellservice.no/: Lese- og skriveprøver,
STAS, Kartleggingsprøve i matematikk: gennemset.
Skoleporten: https://skoleporten.udir.no: Grunnskole, Verktøy – set.
Utdanningsdirektoratet: https://www.udir.no.
Utdanningsforskning (Utdanningsforbundets nettside): https://utdanningsforskning.no:
Gennemset Tester og kartlegging.
Utdanningsnytt: https://www.utdanningsnytt.no/skole: Skole, nyeste publikationer gennem-
set, ingen valgt. Søgt Test Matematikk / Test Lesing: De første siders fund gennemset.
Finland
Ministry of Education and Culture:
https://minedu.fi/en/frontpage:
Publikationer gennemset
(på engelsk eller svensk, ikke finsk).
The Finnish National Agency for Education:
https://www.oph.fi/english:
Publikationer gen-
nemset.
England
Department for Education:
https://www.gov.uk/government/organisations/department-for-
education
Publikationger gennemset.
164
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0165.png
Ofqual
The
Office
of
Qualifications
and
Examinations
Regulation:
https://www.gov.uk/government/organisations/ofqual:
Publikationer gennemset.
Standards & Testing Agency:
https://www.gov.uk/government/organisations/standards-
and-testing-agency:
Publikationer gennemset.
NFER – National Foundation for Educational Research:
https://www.nfer.ac.uk/:
Publika-
tioner gennemset.
Nordirland
Council for the Curriculum, Examinations and Assessment:
http://ccea.org.uk/:
Publika-
tioner gennemset.
Tyskland
Federal Ministry of Education and Research:
https://www.bmbf.de/en/index.html:
Publika-
tioner gennemset (engelsk, ikke tysk).
Belgien
Flemish Government:
https://www.vlaanderen.be/en
Publikationer gennemset.
USA
U.S. Department of Education:
https://www.ed.gov/
Publikationer gennemset.
NCES – National Center for Education Statistics:
https://nces.ed.gov/
Publikationer gen-
nemset.
NAEP – National Assessment of Educational Progress:
https://nces.ed.gov/nationsreport-
card/
Søgning efter relevante publikationer (National competency/standardized test, edu-
cational assessment, testing programs…).
Ved netsøgning.
Frankrig
Ministére de L’education:
https://www.education.gouv.fr/pid37987/for-school-trust.html
Publikationer gennemset (engelsk).
Holland
Ministry of Education, Culture and Science:
https://www.government.nl/ministries/ministry-
of-education-culture-and-science
Publikationer gennemset.
Canada
Ministry of Education:
http://www.edu.gov.on.ca/eng/publications/
Publikationer gen-
nemset.
Australien
Department of Education:
https://www.education.gov.au/
Publikationer gennemset.
Australian Curriculum, Assessment and Reporting Authority:
https://www.acara.edu.au/
Publikationer (‘reporting’) gennemset.
NAP – National Assessment Program:
https://www.nap.edu.au/
Publikationer (‘Results and
reports’ + ‘Resources’) gennemset.
165
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0166.png
New Zealand
Ministry of Education:
http://www.education.govt.nz/
Publikationer gennemset.
Singapore
Ministry of Education:
https://www.moe.gov.sg/
Publikationer gennemset.
Singapore Examinations and Assessment Board:
https://www.seab.gov.sg/
Publikationer
gennemset.
Sydkorea
Ministry of Education:
http://english.moe.go.kr/main.do?s=english
Publikationer (’Docu-
ment Archive’) gennemset.
Japan
Ministry of Education, Culture, Sports, Science and Technology:
http://www.mext.go.jp/en/
Publikationer (‘Report & Statistics’) gennemset.
‘Internationale’
IEA (International Association for the Evaluation of Educational Achievement)
Progress in International Reading Literacy Study:
https://en.wikipedia.org/wiki/Progress_in_In-
ternational_Reading_Literacy_Study
søgning resulterede i 1.702 referencer (se Tabel 5.1).
Tabel 5.1
Database
National biblioteksdatabase Danmark (DanBib)
National biblioteksdatabase Sverige (Libris)
National biblioteksdatabase Norge (ORIA)
Education Resources Information Center (ERIC)
Academic Search Premier
Teacher Reference Center (Ebsco)
PsycInfo
SocIndex
Web of Science SSCI
Hjemmesider
Diverse – fra videresøgning/’snowballing’
I alt
Kilde:
Tal på baggrund af den systematiske litteratursøgning.
Referencer fordelt på databaser
Hits
153
104
33
694
160
108
101
8
244
79
18
1.702
I
fase 2
blev alle fundne referencer screenet gennem analyser af titler, emneord og abstracts
for, om de besvarede undersøgelsesspørgsmålet og overholdt inklusions- og eksklusionskrite-
rierne. Ved tvivlsspørgsmål blev hele referencen screenet. På denne baggrund blev 356 studier
vurderet relevante, mens 1.346 blev vurderet irrelevante.
166
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0167.png
Figur 5.1
Systematisk litteratursøgning – del 1
Fase 1:
Screening af potentielt
relevante studier via
elektroniske databaser og
hjemmesider
Potentielt relevante
test (1.702)
Fase 2:
Evaluering af
relevansen af disse studier i
forhold til ovenstående
eksklusionskriterier
Relevante (356)
Ikke relevante (1.346)
5.2.2
Del 2
Fase 3
opdelte alle referencer i den test, de omhandlede. Dette resulterede i identifikationen
af 116 forskellige test.
Figur 5.2
Systematisk testkortlægning – del 2
Fase 3:
Udfra søgningen i fase
2 identificeres relevante test
Relevante test (116)
Fase 4:
Systematisk
gennemgang af formål, indhold
og princip
Ikke relevante (14)
Relevante - inkl. 4 nye
studier (106)
Fase 4
bestod af en systematisk gennemgang af alle testene via formål, indhold og princip jf.
afsnit 2. Dette førte til, at nogle test blev vurderet irrelevante, fx grundet forældelse, mens nye
167
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0168.png
test blev tilføjet, hvis en gammel var erstattet af en ny. Samlet set blev 14 test vurderet irrele-
vante, mens 4 nye test blev tilføjet. I alt resulterede kortlægningen i en analyse af 106 test.
I forbindelse med den systematiske gennemgang i fase 4 viste det sig også, at mange referen-
cer ikke gav en teknisk beskrivelse eller indeholdt en validering af testen. Dette skyldes, at de
fleste studier ikke beskriver en test, men derimod blot anvender den som et outcome i en anden
videnskabelig sammenhæng. Vi har derefter manuelt søgt yderligere information om den givne
test, typisk via testudbyderens hjemmeside. Det viste sig hurtigt, at meget af den relevante
information var tilgængelig i tekniske rapporter, såfremt en testudbyder har offentliggjort en
sådan.
8
Vi valgte derfor specifikt at lave en googlesøgning på ”technical manual/report + te-
stens navn”.
9
De nye referencer er derefter tilføjet litteraturlisten.
8
9
De tekniske rapporter er ikke kommet frem i databasesøgningerne, da de ikke nødvendigvis er peer-reviewet.
Hvis testen var dansk, norsk eller svensk, brugte vi nationale formuleringer.
168
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
Litteratur
Dee, T.S. & Jacob, B. 2011, "The impact of No Child Left Behind on student achievement",
Journal of Policy Analysis and Management,
vol. 30, no. 3, pp. 418-446.
Gough, D. 2004, "Systematic research synthesis to inform the development of policy and
practice in education" in Thomas, G. & Pring, R. (eds):
Evidence-based Practice.
Buck-
ingham: Open University Press, pp. 44-62.
Hambleton, R.K. & Swaminathan, H. 2013,
Item response theory: Principles and applications.
New York: Springer Science & Business Media.
Pedersen, H.S., Flarup, L.H. & Arendt, K.S. 2018,
Faglig udvikling, trivsel og alsidig udvikling
blandt elever med særlige behov. En redskabskortlægning og praksisafdækning.
Kø-
benhavn: VIVE - Det Nationale Forsknings- og Analysecenter for Velfærd.
Undervisningsministeriet (2005).
Lov om ændring af lov om folkeskolen L101.
København:
Undervisningsministeriet.
Undervisningsministeriet (2006).
Lov om ændring af lov om folkeskolen L170.
København:
Undervisningsministeriet.
169
BUU, Alm.del - 2019-20 - Bilag 82: Anbefalinger, evaluering og faktaark om nationale test, fra børne- og undervisningsministeren
2146467_0170.png