Retsudvalget 2013-14
REU Alm.del Bilag 364
Offentligt
1396014_0001.png
Gør verden til et bedre sted med Big data
De nye muligheder for samkøring af data giver kæmpe fordele. Brugt på den rigtige
måde er der både erhvervsmæssige, personlige og stor samfundsmæssige gevinster
at hente. Men er vi gearet til at udnytte mulighederne bedst muligt?
Hvad er Big data og hvad kan vi med det?
Begrebet Big data er relativt nyt – til gengæld
bruges det rigtig tit. Men det er en usikker
størrelse med løbende nye bud på definitioner.
Den klassiske definition er store mængder af
meget forskellige data fra forskellige kilder,
behandlet i højt tempo. Store mængder af data
skal i denne sammenhæng forstås som et så stort
antal informationer, at traditionelle måder at
behandle data på ikke er nok. Men Big Data er
ikke blot mange data, det er også data fra mange
forskellige kilder og dermed bliver pålidelighed i
data en vigtig faktor.
Big data har et åbenlyst potentiale især ved
bedre brug af ikke-personfølsomme data. Det
skal udnyttes. Men Big data hænger ofte uløseligt
sammen med persondata. Det er fra datamining
af persondata, at de store økonomiske værdier
ligger. Hvor Big data ofte betegnes som det nye
sort, så er persondata betegnet som ”the new
oil”. Og hvis persondata er ny olie, så er Big data
den ”maskine”, der skal pumpe det op.
1
Omvendt, hvis vi ikke tager hensyn til privatlivets
fred og persondatasikkerheden, så forsvinder
tilliden til at lade persondata indsamle og dermed
tørrer oliekilden ud.
EU kommissionen anslår, at værdien af
europæernes persondata har en potentiel
vækstmulighed på tæt på 1 mia. euro frem til
2020.
2
Hvis Big data skal være en kilde til vækst i
Danmark, skal vi blive bedre til at bruge denne
”maskine”, så vi får mest muligt ud af den, men vi
skal i høj grad også gøre den nye olie til en
vedvarende energikilde. Det gør vi ved at sikre de
Big Privacy: Bridging Big data and the Personal Data Ecosystem
Through Privacy by Design, Ann Cavoukia & Drummond Reed
2
Factsheet: Data protection: Progress on EU reform now
irreversible after European Parliament vote, 12. Marts 2014:
http://ec.europa.eu/justice/data-protection/law/index_en.htm
1
følsomme persondata mod lækager, misbrug og
offentliggørelse. Indsatsen vil skulle gå på tre
ben: Strammere og mere klar lovgivning, CSR og
mulighed for mere bevidst personlig adfærd.
Definitioner af Big data:
Gartner’s klassiske 3 V’er:
Big data er kendetegnet ved:
Volume (mængde): Større mængder af
data end normale systemer kan håndtere.
Velocity (hastighed): Højt tempo i
datatilstrømning.
Variety (mangfoldighed): Mange
forskellige datatyper og kilder.
Efterfølgende er endnu et v blevet
foreslået:
Veracity: Sandfærdighed eller måske mere
korrekt, pålidelighed. Hvordan kan vi
sortere mellem pålideligheden af de
mange data.
Hvor stort er store mængder data?
En anden definition giver en vigtig
indikation af dette:
””Big data ” refers to datasets whose size
is beyond the ability of typical database
software tools to capture, store, manage,
and analyze”.
Big data technologies:
En ny generation af teknologier og
arkitekturer, designet til økonomisk at
udtrække værdi fra meget store mængder
data, ved i højt tempo at opsamle, opdage
og eller analysere data.
Kilde: Wikipedia, 29.01.2014 og Ann Covoukian & Jeff
Jonas.
Ingeniørforeningen, IDA
Kalvebod Brygge 31-33
DK-1780 København V
+45 33 18 48 48
[email protected]
ida.dk
PDF to HTML - Convert PDF files to HTML files
1396014_0002.png
Big data som game changer
Springet fra tidligere registrering af data til Big
data handler om mængder som er langt større
end tidligere. Men den afgørende forskel er at
data indsamles fra en langt større mængde og
variation af kilder. Eksempelvis begynder
virksomheder ikke bare at trække på egne data,
men også på data fra kunder og leverandører,
sensorer i de produkter virksomheder har solgt,
offentlige registre og datasamlinger, sociale
medier etc. Disse forskellige data indsamles og
behandles med nye typer algoritmer og bedre
computerregnekraft og kan være med til at styrke
virksomhedens beslutningsgrundlag. Dette giver
mulighed for ikke bare at lave en evaluering af,
om det man har gjort er godt nok, men også
fremadrettet at forudsige, hvor virksomheden
skal sætte ind i forhold til at skaffe flere og bedre
kunder eller f.eks. undgå slidtage og fejlmeldinger
på produkter.
Det er endnu få danske virksomheder, der for
alvor udnytter mulighederne og udviklingen går
lidt langsommere end i andre lande. For dem, har
der ofte været tale om en gradvis udvikling, hvor
de over tid har investeret i bedre registrering og
ajourføring af egne data, inddragelse af nye
eksterne datakilder, bedre software og værktøjer
og dygtigere analytikere. Blandt SMV’erne er det
kendetegnet, at de enten har en lang tradition for
indsamling af data eller er meget ingeniørtunge.
Blandt de afgørende forudsætninger for at kunne
bruge Big data er:
1.
2.
3.
Højt videns- og kompetenceniveau indenfor
data, teknologi og dataanalyse
Høj grad af digitalisering i virksomheden
Der er ofte et spring til nye
forretningsmodeller, f.eks. hvor service og
rådgivning knyttes direkte til produktet.
personfølsomme data og hjælp i form af
rådgiving og støtte til at komme i gang.
3
Eksempler på brug af Big data i danske
virksomheder
Overblik over egne data:
Grundfos har opbygget et Enterprise
Ressource Productivity (ERP) system, hvor
virksomheden blandt andet lagrer alle interne
transaktionsdata, produktionsdata,
logistikdata, mv. i alt ca. 5 petabytes data (5
millioner gigabytes). Systemet er brugt ved
analyser, der har ført til effektiviseringer i
produktionen og i arbejdsgangene.
Kombination af egne og andres data:
Saxo.com har brugt sine egne salgssdata om
bøger i kombination med eksterne
demografiske data til at udvikle en
anbefalingsalgoritme, der bruges til at
anbefale endnu en bog, når den første er lagt
i ”indkøbskurven”. Det betød en stigning i
salget på 12 %.
Datadreven innovation
:
Hapti.com udvikler online spilprodukter og
bruger data-aftryk fra kundernes brug af
spilprodukter til løbende produktudvikling ud
fra kendskab til frafaldsmønstret for forskellige
aldersgrupper, der kan indikere om spil er for
svære eller for kedelige.
Optimering af kundeservice:
Vestas anvender Big data til at forkorte
beregningsperioden og til at give et bedre
statistisk beslutningsgrundlag for opstilling af
vindmøller, bl.a. fordi måleperioden kan
forkortes fra 18 måneder til 15 minutter.
Vestas udviklede i 2010-2011 ”Firestone
Computer” sammen med IBM, den største og
hurtigste computer i Danmark og i 2011 den
3. største kommercielle computer i verden.
Kilde: ”Big data som vækstfaktor i dansk erhvervsliv”,
Erhvervsstyrelsen, Irisgroup, december 2013.
Blandt barriererne er omvendt stigende mangel
på analytikere, manglende adgang til offentlige
data, uklare regler for anvendelse af
”Big data som vækstfaktor i dansk erhvervsliv”,
Erhvervsstyrelsen, Irisgroup, december 2013.
3
Ingeniørforeningen, IDA
Kalvebod Brygge 31-33
DK-1780 København V
+45 33 18 48 48
[email protected]
ida.dk
PDF to HTML - Convert PDF files to HTML files
1396014_0003.png
Business case eller samfundsinvestering
Infrastruktur og forskning i sundhed er blandt de
områder, hvor Big data kan være en game
changer.
Brug af det danske CPR-register og EPJ er et
positivt eksempel på offentlig anvendelse af Big
Data i forbindelse med for eksempel
kræftforskning og sundhedsanalyser. Et andet
eksempel er sporing af fordærvet kød, der via
bon’er kan spores til konkrete købere.
Transportdata kan bruges til at optimere folks
kørsel/transportvaner vel at mærke uden at man
derved kompromitterer privacy. Det gøres
eksempelvis af Transport for London, TfL. TfL
opsamler data og lægger ud, hvem uden at man
kan se, hvem der er afgiver af data.
Den 1. januar 2013 blev der givet fri adgang til en
række offentlige grunddata. Dette har allerede
givet grundlag for en række virksomheder.
4
En samfundsmæssig gevinst kræver, at vi sikrer,
at vi får mest muligt ud af de data, der indsamles.
Der er imidlertid to udfordringer, der skal løses
før det kan lade sig gøre.
For det første er det en udfordring, hvis det
offentlige tjener penge på at holde på de data,
der er opsamlet. Det gælder især, hvis det
ligefrem ligger i forretningsplanen, at der skal
tjenes penge på brug af data.
Digitaliseringsstyrelsen er i gang med at få det
offentlige i spil. Men ikke i alle tilfælde er der en
businesscase. Her bør det overvejes om ikke der
er samfundsgevinst i at infrastrukturejerne, f.eks.
staten og kommunerne, investerer i f. eks.
trafikdata, som en investering i effektiv
udnyttelse af vejnettet.
Men også virksomhederne er nærige med
informationer. De mest nyttige informationer til
brug for viden om god kørsel er f.eks. låst i
bilerne fra producenternes side. Så selv om man
måske nok kunne forestille sig, at en del bilister
gerne bytte private data for bilkørsel for mere og
bedre information om kørsel i egen bil, så er det
ikke muligt at lave det optimale
sammenligningsværktøj.
4
Det ultimative krav er selvfølgelig, at hvis ikke-
personfølsomme data er opsamlet, så skal de
udleveres til den data vedrører, f.eks.
ejeren/føreren af bilen. Et minimums krav må
være, at der i langt højere grad bliver låst op for
adgang til ikke-personfølsomme data, som
minimum der, hvor der er tale om det offentlige
Danmarks data. For virksomhederne bør der
oprettes et samlingspunkt, en portal, hvor
virksomheder kan udbyde og byde på
datamængder. Den anden udfodring er, at loven
bliver klar at følge for virksomhederne og vækker
den nødvendige tillid blandt befolkningen.
Usikkerhed om lovgivning er en barriere
EU kommissionens Data Protection reform er en
vigtig milesten på vejen til en mere fair og
tillidsvækkende brug af de muligheder Big data
giver. Hovedpointerne heri er bl.a.
Ét kontinent – én lov:
En samlet lov vil give større
sikkerhed og klare linjer for både brugere og
virksomheder og mindre bureaukrati for
virksomhederne, da man ikke længere skal
forholde sig til 27 forskellige sæt dataregler.
One-stop-shop:
Virksomheder vil herefter kun
skulle forholde sig til én myndighed.
Samme regler og mindre bureaukrati:
Ens vilkår
for alle virksomheder, der opererer i EU-landene,
uanset om de er placeret i eller udenfor EU.
En samordning af regler og praksis forventes at
kunne spare europæiske virksomheder for 2,3
mia. euro om året. Samtidig forventes det, at
stærkere og klarere regler vil opbygge tillid til
europæiske virksomheder, hvilket vil være en
global konkurrencefordel efterhånden som netop
privacy vil få større og større opmærksomhed.
”Big data som vækstfaktor i dansk erhvervsliv”, Erhvervsstyrelsen,
Irisgroup, december 2013
.
Ingeniørforeningen, IDA
Kalvebod Brygge 31-33
DK-1780 København V
+45 33 18 48 48
[email protected]
ida.dk
PDF to HTML - Convert PDF files to HTML files
1396014_0004.png
IDA anbefaler
At regeringen udarbejder en
handlingsplan for, hvor Big data kan være
med til at forbedre velfærden i Danmark,
herunder, hvordan man styrker
virksomhedernes kendskab til og brug af
Big data.
At stat, regioner og kommuner stiller
ikke-personfølsomme data til rådighed og
fri afbenyttelse
At de ikke-personfølsomme offentlige
data lægges frem, i en let tilgængelig
form fra samme portal, ligesom
der
med fordel kunne oprettes en portal for
private virksomheders køb og salg af ikke-
personfølsomme data.
At regeringen udvikler en strategi for,
hvordan man støtter op om brugen af
design af personfølsomme data efter
principperne i privacy-by-design, så de
bliver brugbare i anonym form og ikke
ved hjælp af samkøring med andre data
kan de-anonymiseres, dvs. at man kan
identificere individer bag de
personfølsomme oplysninger. Dette
kunne konkret gøres ved markedsføring
af gode eksempler.
At der skabes
efteruddannelsesmiljøer, der kan
styrke kompetencerne hos
matematikere, dataloger, ingeniører
m.v. i forhold til at arbejde med big
data analyseværktøjer, store
datamængder, varierende kilder som
tekstdata og data fra human sensors,
samt den nødvendige forståelse for de
sikkerhedsmæssige perspektiver
At der skabes de nødvendige
forsknings- og uddannelsesmæssige
miljøer i Danmark på verdensniveau,
der kan sikre fremtidige kompetencer
hos matematikere, dataloger,
ingeniører m.v. i forhold til at arbejde
med big data analyseværktøjer, store
datamængder, varierende kilder som
tekstdata og data fra f.eks. human
sensors, samt den nødvendige
forståelse for de sikkerhedsmæssige
perspektiver.
Vil du vide mere?
Kontakt
Chefkonsulent Grit Munk
[email protected],
tlf: 30596596
Chef for Politik, Presse og Analyse Søren
Lauridsen,
[email protected],
tlf: 30637723
Ingeniørforeningen, IDA
Kalvebod Brygge 31-33
DK-1780 København V
+45 33 18 48 48
[email protected]
ida.dk
PDF to HTML - Convert PDF files to HTML files
1396014_0005.png
Ingeniørforeningen, IDA
Kalvebod Brygge 31-33
DK-1780 København V
+45 33 18 48 48
[email protected]
ida.dk