Miljø- og Fødevareudvalget 2015-16
L 68
Offentligt
1601714_0001.png
UDKAST
Beregning af afstrømningsnormaliseret
belastningsniveau til vandområder
Notat fra DCE - Nationalt Center for Miljø og Energi
Dato: 23. oktober 2015
Søren E. Larsen og Jørgen Windolf
Institut for Bioscience
Rekvirent:
Naturstyrelsen
Antal sider: 11
Faglig kommentering:
Kvalitetssikring, centret:
Poul Nordemann Jensen
AU
AARHUS
UNIVERSITET
DCE – NATIONALT CENTER FOR MILJØ OG ENERGI
Tlf.: 8715 0000
E-mail: [email protected]
http://dce.au.dk
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
Indhold
Baggrund
Opgaveformulering
Datagrundlag
Metoder
Resultater
Konklusion
Referencer
3
3
4
4
8
10
11
2
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
Baggrund
I Vandområdeplanerne er de aktuelle belastninger af kvælstof og fosfor be-
regnet for perioden frem til og med 2012. Disse årlige belastninger er vand-
føringsnormaliserede ved anvendelse af den gennemsnitlige vandføring for
en længere periode, nemlig 1990-2012, således at belastninger justeres for af-
strømningens indflydelse på udvaskning og transport af næringsstoffer i
vandløbene. Der foreligger således en tidsserie af vandføringskorrigerede
belastninger af N og P for hvert delopland i Vandområdeplanerne. Statusbe-
lastningen, som skal beskrive et vandføringsnormaliseret belastningsniveau
svarende til året 2012, er særdeles vigtigt i fastsættelsen af indsatsbehovet
for de enkelte delvandsoplande.
For nuværende er statusbelastningen beregnet som et simpelt gennemsnit af
de vandføringsnormaliserede belastninger i perioden 2008-2012, det vil sige
som et gennemsnit over 5 år. Argumentet for at anvende et gennemsnit over
5 år er at man derved tager højde for år til år udsving i belastningerne, hvil-
ket man ikke gør ved udelukkende at anvende den vandføringsnormalise-
rede belastning for 2012. I perioden før 2012 er der ligeledes gennemført en
række tiltag, som skulle mindske belastningen af kvælstof. I dette notat un-
dersøges om der er andre metoder til at opgøre statusbelastningen i 2012 –
metoder som udviser en mindre relativ usikkerhed end det simple 5 årsgen-
nemsnit.
Opgaveformulering
Fra Naturstyrelsen:
Ӂrhus Universitet, DCE, anmodes om i samarbejde med Naturstyrelsen at
genberegne statusbelastningen for kvælstof og fosfor for de enkelte del-
vandsoplande på en måde, der både tager højde for de årlige udsving, struk-
turel udvikling i landbruget og den udvikling, der har været i perioden qua
de politiske tiltag. Metodeovervejelserne skal alene forholde sig til 2008-12-
perioden og således ikke generelt, hvorvidt metoden er brugbar for en vil-
kårlig tidsserie. Konkret anmodes om genberegning på baggrund af:
Et 3 års gennemsnit af vandføringsnormaliserede belastningsopgørelser
En bestemmelse af belastningsniveau 2012 ud fra regression over 5 år
(trendanalyse, hhv. lineær og eksponentiel)
Evt. anden metode, som DCE finder bedst egnet.
Følgende forhold ønskes inddraget i vurderingen:
Hvordan metoden tager højde for struktur- og politikudvikling i den på-
gældende periode.
Hvilken betydning for usikkerhed i beskrivelse af belastningsniveau sva-
rende til et enkelt år vil valg af metode have?”
Bemærkninger:
Det er ikke muligt isoleret at tage højde for eller kvantificere effekten af
struktur og politik udviklingen i den pågældende periode. Det der søges til-
vejebragt og er beskrevet i notatet er en metode der vurderer hvorledes ni-
veauet for næringsstofbelastningen var i 2012. De data der analyseres er data
der er afstrømningskorrigerede på årsniveau. Efter afstrømningsnormalise-
ring på årsniveau får man således frembragt data for næringsstofbelastnin-
3
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
gen, der i meget betydelig grad er ’renset’ for betydningen af varierende
ferskvandsafstrømninger fra år til år. Der vil dog stadig være en vis reste-
rende – forventeligt mindre, men ukendt - ’støj’ i de frembragte normalise-
rede data, der kan være relateret til andet end landbrugspraksis de enkelte
år. Her tænkes på den mulige effekt af sæsonvariationer i nedbør, tempera-
tur mv.
Det bemærkes også, at analysen er foretaget på samlede næringstoftranspor-
ter, (diffust bidrag fra det åbne land + spildevand fra punktkilder).
Datagrundlag
Tidsserier med vandføringsnormaliserede belastninger af N og P opgjort til
en række søer og kystvandområder i perioden 2001 - 2012 er leveret af Na-
turstyrelsen til DCE. DCE har af tidsmæssige årsager ikke haft mulighed for
at kvalitetssikre datagrundlaget, hvorfor DCE fraskriver sig ansvaret for
fejlberegninger som følge af evt. fejlbehæftede data leveret af Naturstyrel-
sen.
DCE har dog bemærket negative og relativt meget små vandføringskorrige-
rede belastninger for et mindre antal søoplande (Vandområdeid=2). Fra Jo-
han Lassen, Naturstyrelsen har DCE modtaget følgende forklaring på dette:
” For de omtalte eksempler ligger søerne i målt opland og er ”låst fast” be-
lastningsmæssigt i et delopland ml. to el. flere målestationer, som den årlige
belastning afstemmes til. Søerne har ikke her selv en opstrømsliggende må-
lestation, hvorfor belastningen til de omtalte søer bestemmes af bidraget til
belastningen fra det pågældende delopland ml. målestationer. Hvis denne et
år f. eks. er negativ, ja, så får vi også det pågældende år en negativ belast-
ning til den/de søer, der måtte ligge i deloplandet og som ikke selv har en
opstrømsliggende målestation. De store relative udsving, du ser for nogle af
søerne, vil formentlig være søer, der er placeret på lignende vis i forhold til
målestationerne. Udsvingene afspejler usikkerheden på belastningsopgørel-
sen”. DCE gør opmærksom på at analyser er gennemført på alle data også
negative belastninger og det er således op til Naturstyrelsen selv bagefter at
håndtere disse få søoplande korrekt med hensyn til vurdering at de estime-
rede statusbelastninger for 2012.
Udover de nævnte data fra Naturstyrelsen har DCE inddraget egne tidsserie
oparbejdet fra det nationale overvågningsprogram (NOVANA) i projektet.
Det drejer sig om tidsserier af vandføringsnormaliserede belastninger af N,
hvor også data fra 2013 og 2014 er inkluderet. Disse data omfatter dels data
fra de såkaldte typeoplande (oplande med intens landbrugsdrift, men uden
betydende spildevandsudledninger) samt data fra 114 kystnære målestatio-
ner med kontinuerte måletidsserier siden 1990 (oplandsareal:21.500 km
2
).
Disse data anvendes hovedsageligt til at få et overblik over udviklingen i be-
lastningerne i de to år efter 2012, som der på nuværende tidspunkt er data
for. Derved kan udviklingstendensen efter 2012 inddrages i beslutningen om
den bedst egnede metode til estimering af statusbelastningen i 2012.
Metoder
DCE har valgt at estimere statusbelastningen for 2012 ved anvendelse af en
række forskellige metoder. Her er de 6 forskellige metoder beskrevet i ord:
1. Som et simpelt gennemsnit beregnet på basis af data i perioden 2008-
2012.
4
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
2. Som et estimat beregnet ved anvendelse af parameter estimater fra en li-
neær regression på data fra de 5 år i perioden 2008-2012
3. Som et estimat beregnet på baggrund af en eksponentiel regression på
data fra de 5 år i perioden 2008-2012. Vandføringskorrigerede belastnin-
ger bliver her transformeret med den naturlige logaritme, dernæst fittet
til en lineær regression og estimat tilbage transformeret med eksponentiel
funktionen.
4. Som et simpelt gennemsnit beregnet på basis af data i perioden 2010-
2012.
5. Som et estimat beregnet ved anvendelse af en model med to lineære re-
gressioner på data i perioden 2004-2012. Første regression gælder for pe-
rioden 2004-2009 anden for 2010-2012. Argumentet for dette er at der i
mange vandområder sker et spring/knæk i tidsserien mellem 2009 og
2010.
6. Som et estimat beregnet ved anvendelse af en model med en lineær re-
gression på data i perioden 2004-2009, og med en model med et fast ni-
veau for perioden 2010-2012. Denne metode giver samme estimat som 3
års gennemsnittet, men har den fordel at den også indeholder en model
for tidligere år. Argumentet for dette er at der i mange vandområder sker
et spring/knæk i tidsserien mellem 2009 og 2010.
I projektet estimeres ligeledes den samlede usikkerhed (udtrykt som en pro-
cent) for statusbelastningen beregnet ved hver af de 6 forskellige metoder.
Modellerne i metode 5 og 6 indeholder henholdsvis 4 og 3 statistiske para-
metre og for at opnå en mindre usikkerhed er data fra den udvidet periode
2004-2012 inddraget i analysen.
Alle metoder anvender flere års data og argumentet for dette er, at der skal
tages højde for dels variationer (fejlled) samt for udviklingstendenser i de
anvendte tidsserier. Det er således ikke nok kun at anvende belastningen for
2012, som et estimat for statusbelastningen. Vandføringskorrektionen har
fjernet meste af den variation i tidsserierne som stammer fra afstrømningen.
Men der er flere kilder til fejlled og udviklingstendenser i belastninger:
Normaliseringen tager ikke hensyn til variationer i sæsonafstrømningen.
De seneste år er der sket et skift mod højere afstrømninger i efteråret mod
lavere afstrømninger i det sene forår og start sommer. Dette kan betyde
større tab af kvælstof til vandløb.
Varmt og koldt klima har også, men dog en mindre effekt på udvasknin-
gen af og omsætningen af kvælstof.
Årlige forskelle i udledning fra punktkilder.
Senere beskrives de 6 metoder matematisk, men først skal nogle statistiske
begreber defineres og forklares. Begreberne anvendes til at beskrive og be-
regne metodernes anvendelighed.
Bias
Bias er et statistisk begreb som er udtryk for den systematiske fejl eller
skævhed, der opstår ved estimeringen af en parameter i en statistisk model.
Hvis estimatet er uden bias, kaldes estimatet for centralt. Metoderne 2, 3, 5
og 6 giver alle sammen et centralt estimat for statusbelastningen i 2012. I teo-
rien giver metode 1 og 4 også centrale estimater under antagelsen, at der ik-
ke er en statistisk signifikant udviklingstendens til stede i tidsserien. Med
begrundelse i det lave antal år i tidsserien (henholdsvis 5 og 3) antages det
5
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
1601714_0006.png
som udgangspunkt, at en signifikant trend i data ikke kan afvises og derfor
beregnes bias for metode 1 og 4 som
Varians
æ
.
Begrebet varians er et udtryk for den gennemsnitlige kvadreret standard fejl
på et givent estimat. Beregning af variansen afhænger af estimeringsmeto-
den og formler skrives op i det følgende.
Usikkerheden samlet
Vi vil udtrykke den samlede usikkerhed (også benævnt ved RMSE=”Root
mean squared error”) på et estimat som
Usikkerheden kan også udtrykkes som et procent tal og det beregnes ved
.
%
Bias og varians trade off
100
.
Der er mulighed for at opnå en mindre varians mod at øge bias og omvendt.
Man kan gøre bias mindre ved at øge antallet af parametre i en givet model,
men derved forøges variansen også. Omvendt kan man formindske varian-
sen og samtidig øge bias ved at opstille en model med få parametre (se føl-
gende figur fra Fortmann-Roe, S.; 2012).
Figur 1.
Grafisk fremstilling af
bias – varians tradeoff.
I evalueringen af metoderne lægges der vægt på den samlede usikkerhed på
estimaterne, men lille varians vægtes højere end lille bias, fordi det anses som
en vigtigere egenskab at estimatet er centralt end meget præcist (lav varians).
I det følgende opskrives beregningsformler for dels estimat for statusbelast-
ningen i 2012 samt for kvadratroden af variansen som benævnes ved estima-
tet standardfejl (SE), med reference til den statistiske lærebog at Snedecor og
Cochran fra 1989. For de 6 forskellige metoder har vi:
6
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
1601714_0007.png
5 års gennemsnit
%
2012
$
5
+
*$
.,-
/
5 års regression
%
2012
$
5
1
0 ( *$
1
5
12 ,,3
1
(
$
5
2012
,-
2008
$
.,-
/
+
+
,-
*$
.8
/
5 års eksponentiel regression
%
$
2012
5 $;
%
4
8
6
5 ∙ 2012
∙9
1
5
,-
12 ,,3
2012
%
$;
*
4
+
*$
B
.=>?
,-
/
6
5 ∙ 2012
/
∙ $;
*
0,5 ∙
$
+
CDE
1
∙9
5
.=>?
,-
,-
12 ,,3
2012
@
A
1,
/
3 års gennemsnit
%
2012
$
3
$
G,-
+
Model med 2 regressioner
%
2012
$
2
1
0 (
3
%
4
2
1
(
$
3
2012
,-
2010
12 ,-,
$
1
$
G,-
+
$
+
H8
,-
6
5
2
∙ 2012
H8
1
∙9
3
,-
12 ,-,
2012
Model med 1 regression samt et 3 års gennemsnit
%
2012
$
2
+
*$
HC
,-
/
1
(
$
3
2012
2010
HC
7
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
1601714_0008.png
I formlerne står
MSE
t
for den beregnede ”Mean squared error” for modellen
med benævnelsen
t.
Med
t=log
menes der den lineære model for perioden
2008-2012, hvor belastninger er transformeret med den naturlige logaritme.
Resultater
Opgaveformuleringen fra NST beskriver at metodeovervejelserne alene skal
forholde sig til data fra perioden 2008-2012. Men nærmere analyse af data
viser, at et stort antal af tidsserierne skifter karakter omkring årene 2009 og
2010, hvilket er et stærkt argument for at medtage flere år i metodeovervejel-
serne. Derfor er det valgt at udvide perioden til 2004-2012 for to af metoder-
ne som beskrevet ovenfor. Som følgende figurer viser, så er udviklingen i
perioden 2004-2012 også yderst varierende.
Klimanormaliserede N belastninger [kg]
Klimanormaliserede n belastninger [kg]
60000
55000
50000
2004
2006
2008
¯r
2010
2012
300000
45000
400000
500000
600000
65000
2004
2006
2008
¯r
2010
2012
Klimanormaliserede N belastninger [kg]
Klimanormaliserede n belastninger [kg]
2004
2006
2008
¯r
2010
2012
10000
7500
5000
150000
200000
250000
300000
12500
350000
15000
2004
2006
2008
¯r
2010
2012
Figur 2.
Eksempler på udviklinger i vandføringsnormaliserede belastninger af kvælstof i perioden 2004-2012. Metode 5 (to
lineære regressioner) er anvendt som fit til data.
Disse figurer dækker med mindre variationer, de mulige forskellige udvik-
linger for den vandføringsnormaliserede belastning af kvælstof i perioden
2004-2012. For vandføringsnormaliserede belastninger af fosfor ser man flere
typer af responser (ikke vist), så som stigende udviklingstendens i hele 2004-
2012, stigende frem til 2009 derefter et fald, konstant i hele perioden, kon-
stant frem til og med 2009 og derefter enten et fald eller en stigning. Figu-
rerne her er vist med fit efter metode 5 (to lineære regressioner gennem pe-
rioden).
Beregninger viser for kvælstof, at metoden som anvender en eksponentiel
regressionsanalyse for data i perioden 2008-2012 samlet set giver den mind-
ste usikkerhed med et gennemsnit på 3,85%. Metoden, som anvender to re-
8
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
1601714_0009.png
gressionsligninger, er den med næst mindst samlede usikkerhed med et
gennemsnit på 4,55%. For fosfor er eksponentiel regression igen den metode
med mindst usikkerhed (3,48%) og igen metoden med to regressioner den
med næstmindst usikkerhed (4,23%).
Aarhus Universitets egne data oparbejdet fra det nationale overvågnings-
program NOVANA omfatter vandføringsnormaliserede tidsserie data fra en
række typeoplande samt summerede data fra målt opland i Danmark omfat-
tende i alt 114 kystnære målestationer med kontinuerte måledata fra 1990-
2014 (opland 21.500 km
2
). Disse viser, at udviklingen i 2013 og 2014 giver
kvælstof-belastninger på niveau med 2012 og i flere tilfælde også belastnin-
ger med et lidt større niveau end i 2012. Dette er illustreret i figur 3 (typeop-
lande) samt i figur 4 (Målt opland i Danmark).
75000
70000
Klimanormaliserede N transporter [kg]
Klimanormaliserede N transporter [kg]
2004
2006
2008
¯r
2010
2012
2014
60000
65000
50000
55000
40000
45000
1000
1250
1500
1750
2000
2004
2006
2008
¯r
2010
2012
2014
Figur 3.
To eksempler på udviklingen i vandføringsnormaliseret kvælstoftransport fra to typeoplande. Data fra Aarhus Universi-
tet, oparbejdet fra det nationale overvågningsprogram NOVANA.
Afstrłmningskorrigerede N belastninger [tons]
25000
27500
30000
32500
Figur 4.
Udviklingen i afstrøm-
ningsnormaliserede kvælstof-
transporter fra det samlede op-
land i Danmark (114 stationer
med kontinuerte tidsserier 1990-
2014, 21.500 km
2
).
35000
2004
2006
2008
¯r
2010
2012
2014
9
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
1601714_0010.png
Derfor er eksponentiel regression for data i perioden 2008-2012 ikke den op-
timale model og vil generelt give for små estimerede statusbelastninger i
2012. Figurerne i figur 2 er fittet med metode 5 og det vil sige der fittes to li-
neære linjer – en for perioden 2004-2009 og en for perioden 2010-2012. Den-
ne model har 4 parametre og ser ud til fint at kunne rumme de 4 forskellige
udviklingstendenser vist i figur 2 samt også de to forskellige tidsserier vist i
figur 3. Metode 5 er altså en generel metode med en model som kan beskrive
rigtigt mange udviklingsforløb i tidsserierne i perioden 2004-2012.
Figur 5.
Resultat af alle 6 meto-
der på et valgt kystopland. Grøn:
Metode 1; Rød: Metode 2; Gul:
Metode 3; Blå: Metode 4; Sort:
Metode 5; Sort (2004-2009), blå
(2010-2012): Metode 6.
Afstrłmningskorrigerede N belastninger [kg]
35000
37500
40000
42500
45000
2004
2006
2008
¯r
2010
2012
Metoderne 1 og 2 baseret på 5 års perioden 2008-2012 er generelt ikke opti-
male, som figurerne i figur 2 viser, fordi der sker et skift i udviklingen for de
fleste tidsseriers vedkommende omkring årene 2009 og 2010. Metode 3 kun-
ne være en kandidat, men fejler for en del tidsserie, hvor der er en stigende
tendens i årene 2011 og 2012. Metode 4, som er et 3 års gennemsnit er en god
kandidat, men har noget bias for de tidsserier med en udviklingstendens i
de 3 sidste år, og det drejer sig om en hel del tidsserier. Metode 6 er i prin-
cippet det samme som metode 4, og det efterlader metode 5, som den bedste
kandidat. Denne metode indeholder en model for perioden 2010-2012 som
både kan beskrive stigende, faldende og konstante belastninger, hvilket er
hvad der optræder i data. Man er nødt til at inkludere flere data i modellen
(2004-2009) således at parametre estimeres med en større præcision. Man
kan godt estimere en regressionslinje på de 3 data punkter fra perioden
2010-2012, men MSE og dermed usikkerheden bliver større sammenlignet
med modellen med de to regressionslinjer.
Metoderne 2, 3, 5 og 6 indeholder alle modeller med udviklingstendenser og
er derfor i stand til at inkludere effekter af strukturelle ændringer i landbru-
get samt effekter af politiske tiltag på udledninger af næringsstoffer.
Konklusion
I dette notat har DCE anvendt 6 forskellige metoder til at estimere en kvælstof
og fosfor statusbelastning for året 2012 og for et stort antal vandområder på
basis af vandføringskorrigerede belastninger for enten perioden 2008-2012 el-
ler perioden 2010-2012. To af metoderne inkluderer ligeledes data fra 2004-
10
L 68 - 2015-16 - Endeligt svar på spørgsmål 62: Spm. om oversendelse af al korrespondance mellem kvælstofudvalget og forskere og forskningsinstitutioner m.fl., til miljø- og fødevareministeren
1601714_0011.png
2007, men disse data anvendes ikke til estimering af belastningen i 2012, men
er medtaget for at illustrere udviklingen i belastninger i perioden 2004-2009.
Estimater for statusbelastningen i 2012, beregnet for alle 6 metoder samt esti-
maternes usikkerhed, leveres til Naturstyrelsen i 4 Excel regneark.
DCE finder, med reference til den totale usikkerhed samt udviklingen af be-
lastninger i 2013 og 14 (Typeoplande og samlet målt opland i Danmark), at
metode 5 bedst beskriver statusbelastningen i 2012. Denne metode beskriver
udviklingen i vandføringskorrigerede belastninger i perioden 2004-2012 ved
anvendelse af to regression linjer og kan dermed tage højde for eventuelle
effekter af strukturændringer i landbruget samt politiske tiltag i denne peri-
ode. Metoden kan alene beskrive udviklingstendenserne, men ikke årsagen
til udviklingstendenserne. Der har ikke været lagt op til i projektet til at ind-
drage en nærmere analyse af udviklingstendenser i punktkilder i vandom-
råderne, men ændringer i punktkilder i den analyserede periode kan også
have en effekt på udviklingstendenser i belastningerne.
DCE anbefaler, at Naturstyrelsen supplerer de beregnede estimater for sta-
tusbelastningen i 2012 med plots af vandføringskorrigerede belastninger for
perioden 2004-2012 eller anden tilsvarende periode, således at udviklingen
belyses grafisk. Endvidere anbefaler DCE at data for 2013 og 2014 oparbej-
des så estimatet for 2012 kan konsolideres.
Referencer
Fortmann_Roe, S. (2012) Understanding the Bias-Variance Tradeoff.
http://scott.fortmann-roe.com/docs/BiasVariance.html
Snedecor, G. W. og Cochran, W. G. (1989) Statistical Methods, Iowa State
University Press, Ames, Iowa 50010.
11