UVT, Alm.del - 2005-06 - Endeligt svar på spørgsmål 41: Spm. om ministeren finder det rimeligt at basere sine konklusioner på et notat om et universitet, der kun i meget ringe omfang benytter og har erfaringer med gruppeeksamener, til videnskabsministeren

SpÃ¸rgsmÃ¥l 39

Vil ministeren oversende Videnskabsministeriets notat af 24. februar 2005 om undersÃ¸gelse af forskellige prÃ¸veformers indflydelse pÃ¥ gennemsnitskaraktererne pÃ¥ Aarhus Universitet (sagsnr. 61587, dok-id 405190)?

Svar:

./.

Vedlagt oversendes Videnskabsministeriets notat af 24. februar 2005 om undersÃ¸gelse af forskellige prÃ¸veformers indflydelse pÃ¥ gennemsnitskaraktererne pÃ¥ Aarhus Universitet (sagsnr. 61587, dok-id 405190).

SpÃ¸rgsmÃ¥l 40

Hvor er der i notatet belÃ¦g for at konkludere, at den enkelte studerendes prÃ¦station ved gruppeeksamener bedÃ¸mmes mere lemfÃ¦ldigt end ved individuelle eksamener?

Svar:

Notatet indeholder ikke udsagn om, at bedÃ¸mmelsen ved gruppeeksamen er lemfÃ¦ldig.

SpÃ¸rgsmÃ¥l 41

Finder ministeren det rimeligt at basere sine konklusioner pÃ¥ et notat om et universitet, der kun i meget ringe omfang benytter og har erfaringer med gruppeeksamener?

Svar:

Jeg vil gerne understrege, at regeringens beslutning om at afskaffe gruppeeksamen ikke baserer sig pÃ¥ en konkret undersÃ¸gelse.

Regeringen har det klare standpunkt, at der bag enhver karakter pÃ¥ eksamensbeviset skal ligge en individuel eksamination.

Regeringen er af den opfattelse, at det ved gruppeprÃ¸ver slÃ¸res - og ikke afslÃ¸res - hvad det enkelte gruppemedlem kan prÃ¦stere. Vi mener, at karakteren ved gruppeprÃ¸ver ikke er sÃ¥ prÃ¦cist et udtryk for den enkeltes standpunkt, som den kunne vÃ¦re, hvis der var eksamineret individuelt. Vi lÃ¦gger vÃ¦gt pÃ¥, at eksamensbeviset tilhÃ¸rer den enkelte og derfor ogsÃ¥ skal afspejle den enkeltes viden og kompetence. Derfor afskaffer vi gruppeprÃ¸ver.

SpÃ¸rgsmÃ¥l 42

Hvad er ministerens kommentar til fÃ¸lgende passus i notatet: â€Der er ingen tvivl om, at gruppeprÃ¸ver generelt bliver hÃ¸jere og â€™smallereâ€™ bedÃ¸mt. Men hvad Ã¥rsagen er er svÃ¦rt at sige. Om dette er fordi bedÃ¸mmelsen af den enkelte er ringere, eller at folk faktisk kan mere, viser modellen intet om. Blot at de bedÃ¸mmes hÃ¸jere. Det er muligt, at der ikke sker en ordentlig bedÃ¸mmelse af den enkelte, fordi denne forsvinder i mÃ¦ngden, men der er ogsÃ¥ mulighed for, at de studerende har lÃ¦rt mere, fÃ¥r hÃ¸jere karakter, kan nogenlunde det samme og fÃ¥r nogenlunde den samme karakter, fordi de netop er i gruppe. Det er ikke muligt pÃ¥ baggrund af de forhÃ¥ndenvÃ¦rende data at se, hvor de ellers ville have landet, hvis det havde vÃ¦ret individuelle eksaminer.â€

Svar:

Jeg henviser til mit svar pÃ¥ spÃ¸rgsmÃ¥l 41.

Bilag

UndersÃ¸gelse af forskellige prÃ¸veformers indflydelse pÃ¥ gennemsnitskaraktererne pÃ¥ Aarhus universitet.

Indledning

I relation til bedÃ¸mmelsen af de studerende til eksamen foregÃ¥r der til stadighed en diskussion om, hvad forskellige prÃ¸veforhold betyder. I den forbindelse har regeringen ivÃ¦rksat en undersÃ¸gelse, der skal se pÃ¥ bedÃ¸mmelsen af den studerende i forbindelse med en redegÃ¸relse om modernisering af prÃ¸ver, eksamener og karakterer.

Det fÃ¸lgende er en generaliseret lineÃ¦r regressionsanalyse af den indflydelse, forskellige forhold omkring prÃ¸ver pÃ¥ universitetet har pÃ¥ gennemsnitskarakteren for studerende, der gennemfÃ¸rte en eksamen pÃ¥ Aarhus Universitet i 2003 og 2004. Herunder forhold som censur, fakultet, eksamenstype og prÃ¸veform.

FÃ¸r resultaterne prÃ¦senteres, prÃ¦senteres de data, som undersÃ¸gelsen baserer sig pÃ¥, samt nogle af de forbehold man er nÃ¸dt til at tage.Â

PrÃ¦sentation

Samplet indeholder 117.969 opgivne prÃ¸ver. Ikke alle disse indgÃ¥r i regressionen, da nogle af dem er bedÃ¸mt bestÃ¥et/ikke-bestÃ¥et og derfor ikke har en angivet karakter. Dette betyder, at gennemsnittet, der bliver omtalt i det fÃ¸lgende, vil vÃ¦re gennemsnittet af de, der har fÃ¥et tildelt en karakter og bestod deres eksamen. Dette trÃ¦kker gennemsnittet op og gÃ¸r det en smule hÃ¸jere end gennemsnittet over alle elever. Dertil kommer, at 13-skalaen ikke indeholder alle punkter, men bryder den fuldstÃ¦ndig lineÃ¦re struktur i springet fra 11 til 13. Dette er ogsÃ¥ med til at lÃ¸fte gennemsnittet en smule, om end ikke meget.

Dette vil dog ikke influere pÃ¥ retningen konklusionen tager. Den er stadig valid.

Det skal ogsÃ¥ bemÃ¦rkes, at de valgte variable ikke er dÃ¦kkende for alle de forhold, der bestemmer den studerendes karakter, men meget vel skulle vÃ¦re dÃ¦kkende for, hvad man kunne kalde de institutionelle omstÃ¦ndigheder ved eksamen.

NedenstÃ¥ende tabel viser en oversigt over de variable, der er medtaget i regressionen i forhold til hvilke omstÃ¦ndigheder omkring eksamen, der kan tÃ¦nkes at have en pÃ¥virkning.

Tabel 1. Variabeloversigt.

Variabel.	Mulige udfald.
KARAKTER (Den afhÃ¦ngige)	06-13
1.1 CENSUR	Ekstern
1.1 CENSUR	Intern
EKSAMENSTYPE	Rene mundtlige prÃ¸ver
	Rene skriftlige prÃ¸ver
	Skriftlige opgaver med mundtligt forsvar
FAKULTET	Humaniora
	Naturvidenskab
	Samfundsvidenskab
	Sundhedsvidenskab
	Teologi
FORM	Gruppe
FORM	Individuel

Kolonnen variabel angiver navnet pÃ¥ variablen og anden kolonne de omstÃ¦ndigheder, som eksamen har vÃ¦ret afholdt under. Dvs. om den har vÃ¦ret bedÃ¸mt internt eller eksternt, hvilken type prÃ¸ve det har vÃ¦ret, pÃ¥ hvilket fakultet den har vÃ¦ret afholdt under og til sidst, om den har vÃ¦ret afholdt som en gruppeeksamen eller som individuel eksamen.

Metode

Det prÃ¦senterede datasÃ¦t er herefter behandlet med statistikprogrammet SAS. Til analysen er der anvendt 72.276 besvarelser, idet de resterende ikke har angivet en karakter. Modellen og resultaterne er prÃ¦senteret i fÃ¸lgende tabel, som vil blive gennemgÃ¥et. FÃ¸rst skal det dog lige forklares, hvordan modellen kan bruges. Dette er prÃ¦senteret i fÃ¸lgende formel, der viser gennemsnitskarakteren for en gruppe givet de estimerede vÃ¦rdier af karakteristika og efterfulgt af et regneeksempel.

Gennemsnitskarakter=

Intercept + (Censur(intern/ekstern)) + (Eksamenstype(R.Skr/R.mundt/Skr. M. Mundt.)) +

(Fakultet( Hum/Nat/Sam/Sun/Teo)) + Form(Gruppe/Individuel))

Gennemsnitskarakteren for en internt bedÃ¸mt, rent skriftlig gruppeeksamen pÃ¥ det humanistiske fakultet er altsÃ¥:

Gennemsnitskarakter =

Intercept (8,9756) + Censur (0,00) + Eksamenstype (-0,4014) + Fakultet (0,1198) + Form (0,4560) = 8,9756 + 0,00 â€“ 0,4014 + 0,1198 + 0,4560

= 9,15

I modellen er nogle af de estimerede vÃ¦rdier 0,00. Disse er det, man kalder referencevÃ¦rdier og er dem, som de andre vÃ¦rdier refererer til. Hvordan dette foregÃ¥r vil blive uddybet senere.

SpredningsmÃ¥lene.

Til at uddybe analysen af de forskellige forhold omkring eksamen er der i analysen medtaget andre mÃ¥l end estimationen. Dette er standardafvigelsen og variansen.

Standardafvigelse

Standardafvigelsen fortÃ¦ller, hvor spredt data er. Ca. 65% falder inden for st. afvigelsen +/- gennemsnittet. Dvs. Jo mindre st. afvigelse, jo mindre spredning.

Varians

Den gennemsnitlige afvigelse fra gennemsnittet og et andet mÃ¥l for spredningen. Det beskriver den gennemsnitlige afvigelse fra gennemsnittet blandt besvarelserne. Dvs. jo stÃ¸rre varians, jo stÃ¸rre spredning.

Resultaterne

NedenstÃ¥ende tabel viser de estimerede bidrag til gennemsnitskarakteren, som er den variabel, som alle de nedenstÃ¥ende forholder sig til. Variablerne vil blive gennemgÃ¥et umiddelbart efter tabellen. Kolonnerne viser variablens navn, de udfald som variablen har, â€™tilskuddetâ€™ til gennemsnitsvÃ¦rdien i forhold til referencen og niveauet for signifikans. Signifikansniveauet ligger for nÃ¦sten alle variable pÃ¥ under 1/10 af en promille. Dvs. der er under 1/10 promille chance for, at estimationen ikke er korrekt. Humaniora ligger pÃ¥ Â½ promille, hvilket dog ikke rykker ved, at estimationerne generelt er hÃ¸jsignifikante og dermed gÃ¦ldende.

Tabel 2. Regressionsmodel over prÃ¸veforhold pÃ¥ Aarhus Universitet.

Variabel.	Mulige udfald	Estimeret vÃ¦rdi	Signifikans niveau
Intercept		8.9756	<.0001
Censur	Ekstern	0.0559	<.0001
Censur	Intern	0.0000*	.
Eksamenstype	Rene mundtlige prÃ¸ver	0.2118	<.0001
	Rene skriftlige prÃ¸ver	-0.4014	<.0001
	Skriftlige opgaver med mundtligt forsvar	0.0000*	.
Fakultet	HUM	0.1198	0.0005
	NAT	0.1875	<.0001
	SAM	-0.3446	<.0001
	SUN	-0.3136	<.0001
	TEO	0.0000*	.
Form	Gruppe	0.4560	<.0001
Form	Individuel	0.0000*	.

*Referencekategori

I det fÃ¸lgende gennemgÃ¥s variablernes betydning i modellen Ã©n for Ã©n, og der knyttes yderligere kommentarer til dem pÃ¥ baggrund af andre mÃ¥lemetoder.

Analyse

Censur

I variablen â€™Censurâ€™ er de eksaminer, der er internt bedÃ¸mt, valgt som reference. Derfor bidrager de ikke til at Ã¦ndre gennemsnitskarakteren positivt eller negativt. Derimod viser det sig, at de eksamener, der er bedÃ¸mt af eksterne censorer, gennemsnitligt ligger 0,0559 karakter over de internt bedÃ¸mte.

NedenstÃ¥ende tabel viser, at standardafvigelsen og variansen er stort set den samme for bedÃ¸mmelser under intern og ekstern censur, og dermed er der ikke er nogen nÃ¦vnevÃ¦rdi forskel pÃ¥ den mÃ¥de, de bedÃ¸mmer pÃ¥.

Tabel 3. Variabeloversigt: Censur

CENSUR	N	Manglende	Fordeling	Gennemsnit	St. Afvigelse	Varians	Median
Ekstern	56248	7733	78%	8,71	1,57	2,46	9
Intern	16028	35622	22%	8,74	1,58	2,50	9

Dette betyder, at der stort set ikke er forskel pÃ¥ interne og eksterne bedÃ¸mmere i forhold til fordelingen af bedÃ¸mmelserne pÃ¥ karakterskalaen.

Fordelingen mellem antallet af eksterne og interne prÃ¸ver er i dette tilfÃ¦lde ikke den faktiske fordeling af internt og eksternt bedÃ¸mte, da en stor del af de internt bedÃ¸mte bliver bedÃ¸mt bestÃ¥et/ikke bestÃ¥et, uden at der gives karakter. TÃ¦ller man disse prÃ¸ver med, bliver fordelingen 55% eksternt bedÃ¸mt og 45% internt bedÃ¸mte.

Fortolkning:

Ekstern bedÃ¸mmelse har altsÃ¥ et lille positivt bidrag til karakteren i forhold til den interne bedÃ¸mmelse, og der bliver bedÃ¸mt pÃ¥ stort set den samme mÃ¥de i forhold til fordelingen af karaktererne pÃ¥ karakterskalaen. En del af forklaringen pÃ¥ dette kan ligge i, at en del af de eksternt bedÃ¸mte eksamener er de store og vigtige eksamener som fx bacheloropgave eller speciale, hvor de studerende dels har vejledning og dels sÃ¦tter sig ekstra op til eksamen. Dette vil trÃ¦kke gennemsnittet op for denne gruppe.

Eksamenstype

Variablen â€™Eksamenstypeâ€™ angiver typen af prÃ¸ve, og her er skriftlige prÃ¸ver med mundtlig forsvar referencen. Det viser sig, at de rene skriftlige prÃ¸ver gennemsnitlig giver 0,40 karakter lavere end de, der er suppleret med et mundtligt forsvar. Det viser sig ogsÃ¥, at de mundtlige prÃ¸ver giver 0,21 karakter hÃ¸jere end de skriftlige med mundtligt forsvar ( og dermed 0,61 karakter hÃ¸jere end de rene skriftlige prÃ¸ver[1]). Rene mundtlige prÃ¸ver bidrager altsÃ¥ positivt til karakteren i forhold til skriftlige opgaver med mundtligt forsvar, og rene skriftlige bedÃ¸mmes gennemsnitlig lavere end tilsvarende med tilhÃ¸rende mundtligt forsvar.

Tabel 4. Variabeloversigt: Eksamenstype

Eksamenstype	N	Manglende	Fordeling	Gennemsnit	St. Afvigelse	Varians	Median
Rene mundtlige prÃ¸ver	19008	25513	26%	9,11	1,53	2,35	9
Rene skriftlige prÃ¸ver	49477	18653	68%	8,53	1,56	2,43	9
Skriftlige opgaver med mundtligt forsvar	4278	1040	6%	9,16	1,48	2,18	9

Spredningen mellem de forskellige eksamenstyper er ikke stor, men viser, at bedÃ¸mmelserne fordeler sig nogenlunde ens ud over karakterskalaen. Dog er der en svag tendens til, at de skriftlige opgaver med mundtligt forsvar samler sig en smule mere omkring gennemsnittet, der ligger en smule lavere for de rene skriftlige opgaver, som den ovenstÃ¥ende regressionsmodel forudsagde.

OgsÃ¥ i denne variabel mangler der mange besvarelser af karakter, hvilket igen kan tilskrives, at en stor del af de observerede eksamener og bedÃ¸mt bestÃ¥et/ikke bestÃ¥et. Tages disse med i fordelingen mellem de forskellige eksamenstyper, bliver fordelingen 38% rent mundtlige prÃ¸ver, 58% rent skriftlige prÃ¸ver og 5% skriftlige prÃ¸ver med mundtligt forsvar.

Fortolkning:

Den mundtlige eksamination krÃ¦ver, at et ekstensivt stof prÃ¦senteres i meget komprimeret form i lÃ¸bet af kort tid, hvor den skriftlige stiller eleven mere til ansvar for, hvad der prÃ¦senteres, idet alt, hvad der pÃ¥stÃ¥s, er dokumenteret i opgaven. Dermed kan det vÃ¦re nemmere for den studerende at skjule de mangler, der er i hans kendskab til stoffet i en situation med mundtlig eksamen. At de skriftlige med mundtligt forsvar ligger imellem de to rent karaktermÃ¦ssigt, kan skyldes, at disse opgaver i mange tilfÃ¦lde er store, og nogle har vejledning gennem forlÃ¸bet og dermed er bedre gennemarbejdet. Denne type eksamen udgÃ¸re kun 6% af dem, der er medtaget i analysen.

Fakultet

Analysen viser, at naturvidenskab generelt bliver bedÃ¸mt hÃ¸jest efterfulgt af humaniora. Samfundsvidenskab bliver hÃ¥rdest bedÃ¸mt, efterfulgt af sundhedsvidenskab. SpredningssmÃ¥let viser, at naturvidenskab har stÃ¸rst spredning i deres bedÃ¸mmelser og sundhedsvidenskab mindst. Mellem de to er der tale om en forskel pÃ¥ 1 karakter i spredningen for ca. 65% af eksaminerne.Â Dog kan man ikke alene pÃ¥ baggrund af dette konkludere, at fx. samfundsvidenskabeligt uddannede har lavere gennemsnitskarakterer, men skal ses i forhold til de andre variable. Fx kunne man forestille sig, at der var flere mundtlige prÃ¸ver pÃ¥ samfundsvidenskab end fx. naturvidenskab, hvilket vil kunne lÃ¸fte karaktergennemsnittet pÃ¥ samfundsvidenskab over naturvidenskab, selvom man generelt bedÃ¸mmer hÃ¸jere der, nÃ¥r man alene ser pÃ¥ fakultetet.

Tabel 5. Variabeloversigt: Fakultet

FAKULTET	N	Manglende	Fordeling	Gennemsnit	St. Afvigelse	Varians	Median
HUM	18499	11212	25%	8,95	1,48	2,20	9
NAT	14912	6544	20%	8,99	1,75	3,07	9
SAM	24013	5465	33%	8,44	1,53	2,33	8
SUN	13042	20084	18%	8,52	1,45	2,09	9
TEO	2297	1901	3%	9,01	1,50	2,24	9

Spredningen i karaktererne pÃ¥ de forskellige fakulteter ligger ogsÃ¥ nogenlunde jÃ¦vnt, dog med en svag tendens til at naturvidenskab spreder sig en smule mere pÃ¥ karakterskalaen. Samfundsvidenskab er det fag, der har det laveste karaktergennemsnit, som ogsÃ¥ regressionsmodellen forudsagde, mens de andre gennemsnit ligger nogenlunde ens. Noget tyder altsÃ¥ pÃ¥, at samfundsvidenskab bedÃ¸mmes lavere uanset andre omkringvÃ¦rende forhold omkring eksamen. Til gengÃ¦lde er samfundsvidenskab, forudsat at de manglende karaktergivninger er eksaminer, der er bedÃ¸mt bestÃ¥et/ikke bestÃ¥et, faget, hvor flest prÃ¸ver resulterer i en karakter. Hele 81% er bedÃ¸mt ved karaktergivning i modsÃ¦tning til fx sundhedsvidenskab, hvor 61% er bedÃ¸mt bestÃ¥et bestÃ¥et/ikke bestÃ¥et.

Fortolkning:

Det er en smule svÃ¦rt at sige noget om, hvorfor der er forskel pÃ¥ de forskellige fakulteter. For samfundsvidenskab kan det dog have noget at gÃ¸re med, at der er mange flere prÃ¸ver, der bliver bedÃ¸mt med en karakter end fx naturvidenskab. Det er muligt, at det forholder sig sÃ¥dan, at man sÃ¦tter sig mere op til de eksaminer, der bliver bedÃ¸mt med karakter, hvis denne slags eksaminer optrÃ¦der sjÃ¦ldnere. Analysen slÃ¥r dog fast, at naturvidenskabelige uddannelser generelt bedÃ¸mmes hÃ¸jest og med mest bredde i brug af karakterskalaen og samfundsvidenskab lavest. Sundhedsvidenskab bliver generelt bedÃ¸mt mest omkring midten af karakterskalaen.

Form

NÃ¥r man ser pÃ¥ formen, hvorunder eksamen har vÃ¦ret udfÃ¸rt, viser modellen, at gruppeeksamener gennemsnitligt bliver bedÃ¸mt 0,45 karakter hÃ¸jere end de individuelle eksamener. Gruppeeksamener yder dermed et betydeligt bidrag til gennemsnitskarakteren. Analysen af spredningen af karaktererne for de individuelle eksamener over for gruppeeksamenerne viser, at der er forskel pÃ¥ de to grupper ud over bidraget til gennemsnitskarakteren. Analysen viser, at gruppeprÃ¸ver har en mindre standardafvigelse og stÃ¸rre varians end de individuelle.

Tabel 6. Variabeloversigt: Form

FORM	N	Manglende	Fordeling	Gennemsnit	St. Afvigelse	Varians	Median
Gruppe	2236	1352	3%	9,33	1,27	1,61	9
Individuel	70527	43854	97%	8,70	1,58	2,48	9

Dette betyder, at eksaminander, der har vÃ¦ret til gruppeeksamen, er blevet bedÃ¸mt mere samlet end de, der har gÃ¥et til individuel eksamen. Gruppeeksamener har altsÃ¥ en tendens til at gruppere sig mere omkring gennemsnittet end de individuelle eksemer, der viser en stÃ¸rre spredning.

Fortolkning:

Der er ingen tvivl om, at gruppeprÃ¸ver generelt bliver hÃ¸jere og â€™smallereâ€™ bedÃ¸mt. Men hvad Ã¥rsagen er er svÃ¦rt at sige. Om dette er fordi bedÃ¸mmelsen af den enkelte er ringere, eller at folk faktisk kan mere, viser modellen intet om. Blot at de bedÃ¸mmes hÃ¸jere. Det er muligt, at der ikke sker en ordentlig bedÃ¸mmelse af den enkelte, fordi denne forsvinder i mÃ¦ngden, men der er ogsÃ¥ mulighed for, at de studerende har lÃ¦rt mere, fÃ¥r hÃ¸jere karakter, kan nogenlunde det samme og fÃ¥r nogenlunde den samme karakter, fordi de netop er i gruppe. Det er ikke muligt pÃ¥ baggrund af de forhÃ¥ndenvÃ¦rende data at se, hvor de ellers ville have landet, hvis det havde vÃ¦ret individuelle eksaminer.

Mulige elaborerende analyser

For at lave en bedre analyse af gruppeprÃ¸ver ville det nok vÃ¦re muligt at sammenligne de enkelte elever under de bestemte prÃ¸veformer over tid. Dvs. se pÃ¥ eleverne en for en og se om deres gennemsnitlige gruppekarakter adskiller sig fra de karakterer, den studerende normalt fÃ¥r i de individuelt bedÃ¸mte eksaminer. Derved ville man fÃ¥ et fingerpeg om, hvorvidt gruppeprÃ¸ver â€™trÃ¦kkerâ€™ nogen i en retning, hvor de ikke bÃ¸r vÃ¦re i forhold til de individuelt bedÃ¸mte eksaminer. Denne analyse vil dog krÃ¦ve lidt samtale med Aarhus Universitet om, hvordan de har anonymiseret deres studerende, men skulle kunne lade sig gÃ¸re.

[1] Den numeriske forskel mellem estimaterne af rent skriftlige prÃ¸ver og rent mundtlige prÃ¸ver. (0,2118 -(-0,4014) = 0,2118+0,4014 = 0,6132)

Indledning

PrÃ¦sentation

1.1 CENSUR

Metode

SpredningsmÃ¥lene.

Standardafvigelse

Varians

Resultaterne

Analyse

Censur

Eksamenstype

Fakultet

Form

Mulige elaborerende analyser