Gør verden til et bedre sted med Big data
De nye muligheder for samkøring af data giver kæmpe fordele. Brugt på den rigtige
måde er der både erhvervsmæssige, personlige og stor samfundsmæssige gevinster
at hente. Men er vi gearet til at udnytte mulighederne bedst muligt?
Hvad er Big data og hvad kan vi med det?
Begrebet Big data er relativt nyt – til gengæld
bruges det rigtig tit. Men det er en usikker
størrelse med løbende nye bud på definitioner.
Den klassiske definition er store mængder af
meget forskellige data fra forskellige kilder,
behandlet i højt tempo. Store mængder af data
skal i denne sammenhæng forstås som et så stort
antal informationer, at traditionelle måder at
behandle data på ikke er nok. Men Big Data er
ikke blot mange data, det er også data fra mange
forskellige kilder og dermed bliver pålidelighed i
data en vigtig faktor.
Big data har et åbenlyst potentiale især ved
bedre brug af ikke-personfølsomme data. Det
skal udnyttes. Men Big data hænger ofte uløseligt
sammen med persondata. Det er fra datamining
af persondata, at de store økonomiske værdier
ligger. Hvor Big data ofte betegnes som det nye
sort, så er persondata betegnet som ”the new
oil”. Og hvis persondata er ny olie, så er Big data
den ”maskine”, der skal pumpe det op.
1
Omvendt, hvis vi ikke tager hensyn til privatlivets
fred og persondatasikkerheden, så forsvinder
tilliden til at lade persondata indsamle og dermed
tørrer oliekilden ud.
EU kommissionen anslår, at værdien af
europæernes persondata har en potentiel
vækstmulighed på tæt på 1 mia. euro frem til
2020.
2
Hvis Big data skal være en kilde til vækst i
Danmark, skal vi blive bedre til at bruge denne
”maskine”, så vi får mest muligt ud af den, men vi
skal i høj grad også gøre den nye olie til en
vedvarende energikilde. Det gør vi ved at sikre de
Big Privacy: Bridging Big data and the Personal Data Ecosystem
Through Privacy by Design, Ann Cavoukia & Drummond Reed
2
Factsheet: Data protection: Progress on EU reform now
irreversible after European Parliament vote, 12. Marts 2014:
http://ec.europa.eu/justice/data-protection/law/index_en.htm
1
følsomme persondata mod lækager, misbrug og
offentliggørelse. Indsatsen vil skulle gå på tre
ben: Strammere og mere klar lovgivning, CSR og
mulighed for mere bevidst personlig adfærd.
Definitioner af Big data:
Gartner’s klassiske 3 V’er:
Big data er kendetegnet ved:
Volume (mængde): Større mængder af
data end normale systemer kan håndtere.
Velocity (hastighed): Højt tempo i
datatilstrømning.
Variety (mangfoldighed): Mange
forskellige datatyper og kilder.
Efterfølgende er endnu et v blevet
foreslået:
Veracity: Sandfærdighed eller måske mere
korrekt, pålidelighed. Hvordan kan vi
sortere mellem pålideligheden af de
mange data.
Hvor stort er store mængder data?
En anden definition giver en vigtig
indikation af dette:
””Big data ” refers to datasets whose size
is beyond the ability of typical database
software tools to capture, store, manage,
and analyze”.
Big data technologies:
En ny generation af teknologier og
arkitekturer, designet til økonomisk at
udtrække værdi fra meget store mængder
data, ved i højt tempo at opsamle, opdage
og eller analysere data.
Kilde: Wikipedia, 29.01.2014 og Ann Covoukian & Jeff
Jonas.
Ingeniørforeningen, IDA
Kalvebod Brygge 31-33
DK-1780 København V
+45 33 18 48 48
ida.dk