Sundheds- og Ældreudvalget 2019-20
SUU Alm.del Bilag 138
Offentligt
2131478_0001.png
København den 29. december 2019.
Til Sundheds- og Ældreudvalget
Vi har i Patientdataforeningen med interesse læst Professor, dr. Jur. Mette Hartlevs notat omhandlende
Juridisk vurdering af mulige modeller for sletning og/eller blokering af fejlagtige oplysninger
(1) fra maj
2019. Overordnet finder vi Mette Hartlevs notat om sletning, rettelse og/eller blokering af fejlagtige
sundhedsoplysninger i patientjournaler velgennemtænkt, lødigt og afbalanceret. Imidlertid tager notatet ikke
tilstrækkeligt hensyn til, at patientjournalen fremadrettet med ændring af Sundhedsloven om
Bedre digitalt
samarbejde i sundhedsvæsenet
(2, 3) kan bruges i forbindelse med automatisk beslutningsstøtte, jvf. tilføjede
§ 42 a, stk. 6, 1. pkt.
Netop nu står vi i det danske sundhedsvæsen på tærsklen til at tage nye teknologier i brug, hvor
big data
og
kunstig intelligens (AI) kombineres. Inden for sundhedsområdet kalder vi det for personlig medicin, når
big
data,
der inkluderer genetiske oplysninger, kombineres med AI. Flere parallelle projekter er netop nu i
opstartsfasen, her kan nævnes Nationalt Genom Center og Persimune/datasø-projektet (4, 5). Tilgangen ses
også inden for eksempelvis skatte-, rets- og socialområdet.
Vores bekymring er, at tilgangen kan være en yderst bekostelig og farlig affære, hvis man ikke allerede ved
opstarten forholder sig realistisk til konsekvenserne af fejlregistrerede data. Det er fejlregistrerede data, der
har været en af hovedårsagerne til, at prisen for SKATS It-system til ejendomsvurderinger, i løbet af fire år
er steget fra knap 100 mio. til 1 mia. kroner (6). SKATS it-system er baseret på
machine learning
(ML), der
er en afart af AI.
Der er derfor behov for, at patienter sikres nogle særlige rettigheder ved brugen af beslutningsstøtte baseret
på AI i forhold til fejlregistrerede data. Det er rettigheder, der bør sikres ved lov og det er rettigheder, som
allerede følger af GDPR. Derudover er der behov for patientsikkerhedsmæssige tiltag.
Skal patientjournalen danne grundlag for automatisk beslutningsstøtte baseret ML, bør man derfor tage
hensyn til en række forhold:
1. Ved automatisk beslutningsstøtte bør borgere have adgang til relevante datagrundlag, således
at fejlregistreringer kan rettes.
2. Den dataansvarlige bør forpligtes til at sætte ressourcer af til systemer, som kan rense
relevante dele af journalen for fejl, når disse dele af journalen skal bruges som grundlag for
beslutningsstøtte.
3. Det bør tages i betragtning, at ingen fejlregistreringer i data, der tjener formål som grundlag
for automatisk beslutningsstøtte, kan betegnes som bagatelagtige
1
.
4. Der bør fastlægges regler for patienterstatning og ansvar, når beslutningsstøttesystemer pga.
fejlregistreringer fører til patientfarlige situationer.
5. Beslutningsstøttesystemer bør i relevant udstrækning testes gennem lodtrækningsforsøg og
gennemgå en formaliseret godkendelsesproces, som det kendes fra lægemidler.
Betydning af fejlregistrering og baggrunden for hvert af de ovenstående punkter uddybes på de efterfølgende
sider.
1
Professor
Mette Hartlev omtaler i sit notat (1) på side 10 fejl, som hun betegner som “bagatelagtige”.
1
SUU, Alm.del - 2019-20 - Bilag 138: Henvendelse af 30/12-19 fra Patientdataforeningen om fejlregistreringer i sundhedsdata
2131478_0002.png
Betydning af fejlregistrerede data ved automatisk beslutningsstøtte og
machine learning
(ML)
Ved ML benyttes selvlærende algoritmer til at genkende mønstre og finde sammenhænge i
big data.
De
selvlærende algoritmer trænes ved hjælp af historiske eksempeldata. Målet er, at ML via disse eksempeldata
og brug af kraftige computere, kan forudse og foreslå beslutninger om for eksempel diagnoser, prognoser og
behandling i forbindelse med lægens arbejde (7, 8). Man kan sige, at man ved hjælp af fortidens udfald,
forsøger at træne algoritmer, som kan forudsige fremtidige udfald for enkeltindivider. Det er det, man også
kalder for profilering.
I den forbindelse kan fejlfyldte data få store konsekvenser for den maskinlæring (9), der skal bruges i
forbindelse med beslutningsstøtte ved præcisionsmedicin (10). Det gælder både for fejl i de massive
mængder eksempeldata, der bruges til at træne algoritmerne, hvor især data med forkerte
labels
(11) og data
med bias (12) kan forstyrre algoritmetræningen; men i særdeleshed gælder det også for fejl i data fra den
enkelte patient, når disse data siden skal bruges af algoritmen i forbindelse med beslutningsstøtte (13, 14).
Betydningen af bias, forkerte labels og andre fejltyper uddybes i bilag 1.
Problemet med fejl kan i nogen grad imødegås ved automatisk fejlkorrektion, og når det gælder tilfældige
fejl, vil algoritmerne i en vis udstrækning være robuste, så længe der anvendes massive mængder
træningsdata. Inden for enkelte højtspecialiserede sygdomme, så som hepatitis C og leukæmi, er vi i
Danmark blandt andet via Datasø-projektet nået langt (15).
Det er dog langt fra muligt at løse alle problemerne ved fejlfyldte datasæt, og korrektion og validering af
store datasæt er en bekostelig og kompliceret affære, som allerede har givet anledning til alvorlige problemer
inden for andre områder end sundhed.
Fejlregistreringer med alvorlige konsekvenser
Ejendomsvurdering: Fejlregistreringer har givet problemer for den automatiske ejendomsvurdering hos
SKAT (16), og problemet har ført til store udgifter (17), uden at problemet er endeligt løst, eksempelvis kom
det nyligt frem, at fejlregistrering har ført til, at 1200 boligejere slet ikke har betalt ejendomsskat (18, 19). På
trods af den langvarige og bekostelige indsats for at løse problemerne omkring vurderingernes præcision, vil
man hos SKAT nu indføre et forsigtighedsprincip, som skal sikre, at den manglende præcision kommer
boligejerne til gode. Det betyder, at det beløb, man som boligejer skal betale skat af, sættes 20 procent lavere
end den offentlige vurdering (20).
Samtidig har SKAT måttet udvikle en digital løsning, hvor boligejere selv kan rette fejl i oplysninger om
boligen i Bygnings- og Boligregistret (BBR) og derved leve op til deres oplysningspligt i forhold til at få
opdateret og rettet oplysningerne (21).
Teledata: At fejl i databaser er udbredte, ses også i Teleskandalen, hvor det for nyligt kom frem, at
telemasters placering har været registreret forkert i politiets it-system. Derudover har det vist sig, at der også
optræder fejl i teleselskabernes egen registrering af deres master. Eksempelvis rapporterede Politiken (22)
for nyligt, at selvom en telemast fra Telia og Telenor ifølge det oplyste befandt sig i Hornsyld, så befinder
masten sig rent faktisk i Vejers Strand 109 kilometer derfra.
Da der blev sjusket med fortegnelsen over master, var der næppe noget, som man var opmærksom på, siden
kunne få konsekvenser for opklaring af mordsager.
Sundhedsdata: Etisk råd har i et høringssvar bekymret sig om fejl og unøjagtigheder i danske sundhedsdata,
og skriver: “Der vil altid forekomme fejl eller mangler, når mange mennesker står for indtastning af data.
2
SUU, Alm.del - 2019-20 - Bilag 138: Henvendelse af 30/12-19 fra Patientdataforeningen om fejlregistreringer i sundhedsdata
2131478_0003.png
Det er utvivlsomt, at der i mange af de eksisterende registre findes data, som er mangelfulde, unøjagtige eller
endog forkerte. Et eksempel er Landspatientregistret.” (23).
At det ikke at let at registrere og indsamle sundhedsdata er også dokumenteret i forbindelse med de
problemfyldte og bekostelige forløb omkring Sundhedsplatformen og det nye Landspatientregister (LPR3),
og det er næppe muligt at lave præcise data om alting på én gang.
Derfor:
1. Ved automatisk beslutningsstøtte bør borgere have adgang til relevante datagrundlag, således
at fejlregistreringer kan rettes.
Den dataansvarliges ansvar for rigtighed af data
En dataansvarlig myndighed har efter databeskyttelsesforordningens (GDPR) artikel 5 et selvstændigt ansvar
for, at oplysninger i sundhedsvæsenets kildesystemer, der er urigtige i forhold til de formål de skal bruges til,
straks slettes eller berigtiges (24). Det er et ansvar, der påhviler den dataansvarlige, uafhængigt af om den
registrerede selv aktivt anmoder om at få oplysningerne korrigeret.
Det følger heraf, at hvis en dataansvarlig ønsker at benytte sundhedsdata fra patientjournaler som træning for
maskinlæringsalgoritmer og efterfølgende at bruge konkrete data fra en enkeltpatient til at lave forslag til
diagnoser, prognose og behandling, må en forudsætning være, at patienten får adgang til de anvendte
dataindikatorer, så fejl kan rettes, samt at der af den dataansvarlige afsættes ressourcer af til at rense
kildesystemer for fejl, også når kildesystemet er en patientjournal.
Derfor:
2. Den dataansvarlige bør forpligtes til at sætte ressourcer af til systemer, som kan rense
relevante dele af journalen for fejl, når disse dele af journalen skal bruges som grundlag for
beslutningsstøtte.
Bagatelagtige fejl kan med maskinlæring få stor betydning
Ved maskinlæring leder computeren efter korrelationer – såkaldte signaler, som kobler indikatorer til udfald.
Stærke signaler kan endda vise sig i data, der normalt betragtes som bagatelagtige. Det ses blandt andet i den
såkaldte “Gladsaxemodel”, hvor man ved hjælp af maskinlæring og algoritmer har forsøgt at lave
dataunderstøttet tidlig opsporing af udsatte børn (29). I modellen indgår udeblivelser hos sundhedsplejerske
og skoletandlæge (30). Registrering af udeblivelse vil for mange være en bagatelagtig information, som kan
give indikation om en familie, der ikke har styr på sagerne, men også være udtryk for eksempelvis dårlig
kalenderstyring hos tandlæge og sundhedspleje.
Hvis Gladsaxemodellen var blevet rullet ud, kunne fejlagtige data om en bagatelagtig udeblivelse have fået
store konsekvenser for de berørte familier. Det betyder, at skal data bruges som udgangspunkt for
beslutningsstøtte, kan fejl, der som udgangspunkt synes trivielle, siden vise sig at have stor betydning.
Derfor:
3. Det bør tages i betragtning, at ingen fejlregistreringer i data, der tjener formål som grundlag
for automatisk beslutningsstøtte, kan betegnes som bagatelagtige.
3
SUU, Alm.del - 2019-20 - Bilag 138: Henvendelse af 30/12-19 fra Patientdataforeningen om fejlregistreringer i sundhedsdata
2131478_0004.png
Manglende patientsikkerhed ved fejlagtige data og beslutningsstøtte
I USA er man så småt begyndt at lovgive, så sundhedsmyndighederne (FDA) kan monitorere og stille
sikkerhedsmæssige krav til brug af kunstig intelligens indenfor sundhedsvæsen (25). Lovgivningsarbejdet er
sat i værk efter, at IBM’s Dr. Watson, som er et beslutningsstøtte værktøj baseret på ML indenfor onkologi,
har foreslået forkert og farlig behandling af patienter (26, 27).
Allerede nu bør man i Danmark overveje at sætte et myndighedsarbejde i gang for at sikre juridiske rammer
for korrektion af fejlagtige journaldata, som skal bruges i forbindelse med beslutningsstøtte og ML. Samtidig
bør det fastlægges hvem, der har ansvaret, når fejlagtige data i forbindelse med ML, forårsager patientfarlige
situationer.
Derfor:
4. Der bør fastlægges regler for patienterstatning og ansvar, når beslutningsstøttesystemer pga.
fejlregistreringer fører til patientfarlige situationer.
Brug af automatisk beslutningsstøtte baseret på AI er en ny og uprøvet teknologi med deraf risici for
systematiske fejlbeslutninger. For nyligt kunne man i Scientific America læse, at AI-systemer slet ikke bliver
så nøje testet som andet medicinsk udstyr, og det på trods af at systemerne allerede har begået alvorlige fejl
(28).
Derfor:
5. Beslutningsstøttesystemer bør i relevant udstrækning testes gennem lodtrækningsforsøg og
gennemgå en formaliseret godkendelsesproces, som det kendes fra lægemidler.
Med venlig hilsen
Thomas Birk Kristiansen
4
SUU, Alm.del - 2019-20 - Bilag 138: Henvendelse af 30/12-19 fra Patientdataforeningen om fejlregistreringer i sundhedsdata
2131478_0005.png
APPENDIX: Om fejl der kan give problemer for ML og beslutningsstøtte
Fejl i
labels
En label skal bruges, når maskinlæring skal oplæres i at genkende et kendetegn eller en attribut om man vil.
En label kan for eksempel være en tumor på røntgenbillede, en anbefalet behandling eller en diagnose.
Problemet er, at fejl i for eksempel diagnoser er mere udbredte (31, 32), end mange i sundhedsvæsenet vil
være ved. Oftest er diagnoser ikke sikre, men blot et udtryk for det, som lægen finder mest sandsynligt.
Omend der også findes visse diagnosetyper, hvor vi er meget sikre på diagnosen, og hvor diagnosedata
derfor kan være af meget høj kvalitet. Fejl i
labels
var et problem for IBM’s Dr. Watson (11). Der findes
situationer og metoder, hvor det er muligt at træne kunstig intelligens uden labels.
Bias er selvforstærkende ved ML
Bias kan snige sig ind i algoritmerne, hvis algoritmen trænes med data, som ikke er repræsentative for den
virkelige verden. I USA har man for eksempel set, at ML, som trænes med data, der hovedsageligt kommer
fra hvide fremfor sorte patienter, skævvrider algoritmer, så de bliver bedre til behandlingen af hvide
patienter. Problemet er set indenfor screening for brystkræft, men kan løses ved at sikre data uden denne type
bias (33). På samme måde kan stemmegenkendelse via ikke-repræsentative træningsdata, trænes til at blive
bedst til at forstå hvide mænd (34). Problemet med bias forstærkes ved beslutningsstøtte af, at bias
efterfølgende også påvirker fremtidens træningsdata.
Bias og den danske medicinalindustri
I Danmark knytter der sig en noget kuriøs risiko for bias til den helt centrale rolle, medicinalindustrien spiller
i det danske sundhedsvæsen.
Steno Diabetes Center er etableret og drevet af midler fra Novo Nordisk Fonden (35, 36). Desuden sker
dataindsamling af journaldata i Region Hovedstaden og Sjælland via Sundhedsplatformen, som danske Novo
Nordisk IT (NNIT) er medleverandør af. NNIT ejes af Novo Holding A/S (37, 38). Denne nære tilknytning
kan have indflydelse på dataindsamling af danske diabetesdata. Som eksempel fik Steno Diabetescenter
Copenhagen på fire uger bygget lokal udbygning af Sundhedsplatformen (39), og som den første af de
kliniske kvalitetsdatabaser er Dansk Voksen Diabetes Database nu fuldt integreret med Sundhedsplatformen
(40). Novo Nordisk fonden har ligeledes doneret en milliard kroner til indsamling af genetiske oplysninger i
Nationalt Genom Center (41).
Desuden er Lægemiddelindustriforeningen via promedicin.dk medleverandør af beslutningsstøtte, som skal
assistere og påvirke medicinordination i almen praksis (42). Endelig har Lundbeckfonden og Novo Nordisk
Fonden i fællesskab doneret 50 millioner kroner til PORCRIN-projektet som skal understøtte, at
sundhedsvæsenets data opsamles systematisk (43, 44).
Faren i Danmark er derfor, at de træningsdata, der skal ligge til grund for træning af algoritmer, ikke bliver
så repræsentative, som de kunne være blevet. I Danmark gælder ellers det grundlæggende princip, at
sundhedsvæsenets rådgivning af patienter, skal være økonomisk uafhængig af medicinalindustrien. Derfor er
der i Sundhedsloven fastlagt regler om samarbejde med medicinalindustrien. Læger, tandlæger og apotekere
må således efter sundhedsloven ikke uden Lægemiddelstyrelsens tilladelse drive eller være knyttet til en
lægemiddelvirksomhed.
Fejl relateret til datatype
Visse datatyper, herunder i særlig grad parakliniske data, er generelt af meget høj kvalitet, hvorfor fejl
sjældent forekommer. For andre datatyper, som bygger på klassisk lægearbejde med beskrivelse af
symptomer og lægeundersøgelse af patienter, kan fejl og forskellige lægers tolkning forårsage stor
heterogenitet i datakvalitet. Derfor er parakliniske data mere velegnede som datagrundlag for trænings- og
inputdata. Det har dog vist sig, at også parakliniske data kan give problemer for
machine learning
(45, 46).
5
SUU, Alm.del - 2019-20 - Bilag 138: Henvendelse af 30/12-19 fra Patientdataforeningen om fejlregistreringer i sundhedsdata
Problemet opstår blandt andet, fordi teknisk apparatur hele tiden ændrer præcision og derfor løbende skal
kalibreres. Datapræcision påvirkes også af apparaturmodel og leverandør, og af personale som betjener
apparaturet. Er tanken, at parakliniske data skal kunne bruges på tværs af det danske sundhedsvæsen i
forbindelse beslutningsstøtte, betyder det, at hele den danske sundhedssektor skal ensrettes, hvad angår
dataindsamling og paraklinisk apparatur i en grad, der kan spærre for udvikling og dynamik. Derfor bør det
vurderes om udgifter herved kan modsvares af eventuelle gevinster.
6
SUU, Alm.del - 2019-20 - Bilag 138: Henvendelse af 30/12-19 fra Patientdataforeningen om fejlregistreringer i sundhedsdata
2131478_0007.png
Referencer:
1.
https://www.ft.dk/samling/20182/spoergsmaal/s243/svar/1590456/2078118/index.htm
2.
https://www.retsinformation.dk/Forms/R0710.aspx?id=208120
3.
https://www.ft.dk/ripdf/samling/20181/lovforslag/l127/20181_l127_som_fremsat.pdf
4.
https://www.regionh.dk/til-fagfolk/Forskning-og-innovation/Teknologisk-infrastruktur-og-it/biobanker-og-personlig-
medicin/Documents/Østdansk%20infrastruktur%20for%20personlig%20medicin.pdf
5.
https://www.dtu.dk/nyheder/2019/02/supercomputere-paa-dtu?id=c2363759-5c79-4503-bb2a-68ef3b65bc69
6.
https://www.version2.dk/artikel/81-960-mio-prisen-it-system-ejendomsvurderinger-mere-end-tidoblet-paa-fire-aar-1087922
7.
https://ida.dk/viden-og-netvaerk/temaer/sundhedsteknologi/machine-learning-kan-forudsige-sygdomsforloeb
8.
https://www.nature.com/articles/srep46226
9.
https://hbr.org/2018/04/if-your-data-is-bad-your-machine-learning-tools-are-useless
10.
https://www.forbes.com/sites/insights-intelai/2019/02/11/how-machine-learning-is-crafting-precision-medicine/
11.
https://www.ibm.com/developerworks/community/blogs/jfp/entry/Some_Limit_To_Supervised_Learning?lang=en
12.
https://www.latimes.com/science/story/2019-10-24/computer-algorithm-fuels-racial-bias-in-us-healthcare
13.
https://hbr.org/2018/04/if-your-data-is-bad-your-machine-learning-tools-are-useless
14.
https://www.bmj.com/content/367/bmj.l6042
15.
https://dagensmedicin.dk/kunstig-intelligens-vrider-skjult-viden-ud-af-rigets-soe-af-patientdata/
16.
https://www.ft.dk/RIPdf/samling/20151/aktstykke/aktstk77/20151_aktstk_afgjort77.pdf
17.
https://www.version2.dk/artikel/skats-nye-system-til-ejendomsvurderinger-bliver-dobbelt-saa-dyrt-683462
18.
https://www.ft.dk/samling/20181/almdel/SAU/bilag/171/2030305/index.htm
19.
https://www.berlingske.dk/dine-penge/fejlramte-boligejere-staar-til-kaempe-skattesmaek
20.
https://www.skm.dk/aktuelt/temaer/boligskat-og-de-offentlige-ejendomsvurderinger
21.
https://www.htk.dk/Service/Nyheder_Presse/Nyhedsoversigt/Nyheder/2018/Maj-18/Ret-selv-BBR-oplysninger-for-din-bolig-i-
ny-digital-selvbetjening.aspx
22.
https://politiken.dk/indland/art7389985/Telefejl-er-endnu-værre-end-antaget
23.
http://www.etiskraad.dk/etiske-temaer/sundhedsdata/hoeringssvar/2018-10-23
24.
https://eur-lex.europa.eu/legal-content/DA/TXT/HTML/?uri=CELEX:32016R0679
25.
https://www.fda.gov/regulatory-information/search-fda-guidance-documents/changes-existing-medical-software-policies-
resulting-section-3060-21st-century-cures-act
26.
https://www.statnews.com/2017/09/05/watson-ibm-cancer/
27.
https://www.japantimes.co.jp/opinion/2018/08/27/commentary/world-commentary/ibms-watson-failed-cancer-ai-may-
win/#.XfjaAS0krs0
28.
https://www.scientificamerican.com/article/artificial-intelligence-is-rushing-into-patient-care-and-could-raise-risks/
29.
https://www.version2.dk/artikel/gladsaxe-kommune-saetter-algoritme-udvikling-paa-pause-1087433
30.
https://politiken.dk/indland/art6365403/Regeringen-vil-overvåge-alle-landets-børnefamilier-og-uddele-point
31. Knap 15 procent af patienterne i det danske diabetesregister har slet ikke diabetes.
https://www.maanedsskriftet.dk/mpl/2014/207/10985/
32. Kræftens Bekæmpelse fik fra cancerregisteret oplysninger om 822 unge med kræftdiagnoser. Alle fik tilsendt et spørgeskema om
og 247 modtagere havde slet ikke en kræftdiagnose.
http://www.tvmidtvest.dk/node/21143
33.
https://news.mit.edu/2019/using-ai-predict-breast-cancer-and-personalize-care-0507
34.
https://hbr.org/2019/05/voice-recognition-still-has-significant-race-and-gender-biases
35.
https://novonordiskfonden.dk/da/projekter-og-initiativer/steno-diabetes-centre/
36.
https://novonordiskfonden.dk/da/nyheder/novo-nordisk-fonden-giver-8354-mio-kr-til-at-styrke-diabetesindsatsen-i-region-
sjaelland/
37.
https://penge.borsen.dk/artikel/19/113494/nnit_storaktionaermeddelelse.html
38. Det fremgår på NNITs hjemmeside at de er en del af Novo-koncernen:
https://www.nnit.dk/om-
os/Sider/historie.aspx?fbclid=IwAR0zfv12KO8DdgOmWslF5N-sD6Ix4BIJq8GaDZxu738i7S0bst9oYA-7ZGM
39.
https://sundhedspolitisktidsskrift.dk/nyheder/648-diabetescenter-fik-pa-fire-uger-bygget-lokal-udbygning-af-
sundhedsplatformen.html
40.
https://www.rkkp.dk/om-rkkp/nyheder/forste-kliniske-kvalitetsdatabase-er-nu-fuldt-integreret-i-Sundhedsplatformen/
41.
https://sum.dk/Aktuelt/Nyheder/Medicin/2018/December/1-mia-kr-paa-vej-til-skraeddersyet-behandling-til-danske-patienter.aspx
42.
https://min.medicin.dk/Generelt/Nyheder/400
43. https://www.rm.dk/sundhed/faginfo/forskning/forskning-og-klinisk-praksis/procrin/
44. https://www.sum.dk/Sundhedsprofessionelle/Forskning/PROCRIN.aspx
45.
https://science.sciencemag.org/content/364/6446/1119
46.
https://nam.edu/wp-content/uploads/2019/12/AI-in-Health-Care-PREPUB-FINAL.pdf
7