Kulturudvalget 2008-09
KUU Alm.del Bilag 240
Offentligt
676616_0001.png
676616_0002.png
676616_0003.png
676616_0004.png
676616_0005.png
676616_0006.png
676616_0007.png
676616_0008.png
676616_0009.png
676616_0010.png
676616_0011.png
676616_0012.png
676616_0013.png
676616_0014.png
676616_0015.png
676616_0016.png
676616_0017.png
676616_0018.png
676616_0019.png
676616_0020.png
676616_0021.png
676616_0022.png
676616_0023.png
676616_0024.png
676616_0025.png
676616_0026.png
676616_0027.png
676616_0028.png
676616_0029.png
676616_0030.png
676616_0031.png
676616_0032.png
676616_0033.png
676616_0034.png
676616_0035.png
676616_0036.png
676616_0037.png
676616_0038.png
676616_0039.png
676616_0040.png
676616_0041.png
676616_0042.png
676616_0043.png
676616_0044.png
676616_0045.png
676616_0046.png
676616_0047.png
676616_0048.png
676616_0049.png
676616_0050.png
676616_0051.png
676616_0052.png
676616_0053.png
676616_0054.png
676616_0055.png
676616_0056.png
676616_0057.png
676616_0058.png
676616_0059.png
676616_0060.png
676616_0061.png
676616_0062.png
676616_0063.png
676616_0064.png
DIGITALISERING AF KULTURARVEN
APRIL 2009
WWW.KUM.DK
DIGITALISERING AFKULTURARVEN— ENDELIG RAPPORT FRADIGITALISERINGSUDVALGET
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Udgivet i 2009 af:KulturministerietNybrogade 21203 København K
Rapporten udgives kun elektronisk på Kulturministeriets hjemmeside,www.kum.dkISBN, elektronisk version: 978-87-7960-130-7
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Indhold1Indledning ............................................................................................................................................. 31.11.2Kommissorium ............................................................................................................................................................... 4Udvalgets arbejde .......................................................................................................................................................... 6
2
Udvalgets overvejelser ...................................................................................................................... 72.12.22.32.42.5Formål med digitalisering af kulturarven................................................................................................................... 8Tilgængeliggørelse af digitaliseret materiale ........................................................................................................... 10Ophavsret ..................................................................................................................................................................... 12Formidling .................................................................................................................................................................... 13Baggrund for udvalgets forslag .................................................................................................................................. 14
3
Forslag 1...............................................................................................................................................173.13.2Udvalgets forslag ......................................................................................................................................................... 17Udvalgets bemærkninger ............................................................................................................................................ 21
4
Forslag 2...............................................................................................................................................244.14.2Udvalgets forslag ......................................................................................................................................................... 24Udvalgets bemærkninger ............................................................................................................................................ 30
5
Forslag 3...............................................................................................................................................325.15.2Udvalgets forslag ......................................................................................................................................................... 32Udvalgets bemærkninger ............................................................................................................................................ 35
Bilag 1:Bilag 2:
Skematisk oversigt over forslag.........................................................................................37Teknisk redegørelse vedr. digitalisering af kulturarven ..........................................38
2
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
1 IndledningI regeringsgrundlaget ”Mulighedernes Samfund” fra november 2007 er digitalisering af kulturarvennævnt med følgende tekst:”Regeringen nedsatte i efteråret 2006 et udvalg med henblik på at få udarbejdet forslag tildigitalisering af udvalgte, prioriterede dele af den danske kulturarv. Regeringen vil fortsætte arbejdetmed digitalisering af kulturarven”.Af regeringsgrundlaget fremgår det endvidere, at:”Kulturarven har væsentlig betydning for danskernes identitetsfølelse i en globaliseret verden, og kunstog kultur får i disse år en stigende betydning. Regeringen vil derfor fortsætte arbejdet med formidling afden danske kulturarv nationalt og internationalt”.Området er yderligere understreget i Kulturministerens Arbejdsprogram fra august 2008.Et initiativ, der har understøttet dette fokus, var nedsættelsen af et udvalg om digitalisering afkulturarven i oktober 2006 som led i den mediepolitiske aftale for 2007-2010. Nedsættelsen af udvalgetudsprang igen af udredningen om bevaring af kulturarven fra 2003, og er i forlængelse af den indsatsfor digitalisering af kulturarven, der allerede er påbegyndt finansieret af UMTS-midler.Udvalgets arbejde skal endvidere ses på baggrund af indsatsen på fælleseuropæisk plan, medstartskud i kommissionens meddelelse i2010: Digitale Biblioteker, der sætter fokus på onlineadgang tilden europæiske kulturarv. Heraf er udsprunget en række initiativer, bl.a. den fælleseuropæiskekulturarvsportal Europeana, som er under opbygning, samt konklusionerne fra Det Europæiske Råd af13. november 2006, hvor medlemsstaterne gensidigt opfordrede hinanden til at udarbejde nationalestrategier for digitalisering af kulturarven, en opfordring som Danmark tilsluttede sig.Den foreliggende rapport konkluderer på udvalgets overvejelser ved at fremlægge tre forskelligeforslag til digitalisering af udvalgte, prioriterede dele af kulturarven. Denne afsluttende rapport skaligen ses på baggrund af udvalgets midtvejsrapport fra 5. september 2008, der i lyset af danske oginternationale erfaringer gennemgik en række faglige, tekniske, organisatoriske og ophavsretsligeproblemstillinger i forbindelse med digitalisering af kulturarven.Det digitaliseringsarbejde, som rapporten beskæftiger sig med, er således afgrænset til at omfattekulturarven. I den forbindelse lægges det til grund, at arbejdet vedrører de samlinger, som statslige ogstatsstøttede institutioner under Kulturministeriet har opbygget i kulturbevaringsøjemed. Det drejersig primært om de institutioner, der opbygger samlinger i henhold til arkivloven, filmloven,museumsloven og pligtafleveringsloven. Hertil kommer på det audiovisuelle område deprogramarkiver, der er opbygget af public service-institutionerne, det vil sige DR og TV 2, samtStatens Mediesamling i Statsbiblioteket. Andre institutioners samlinger af kulturbevaringsmæssiginteresse er indgået i arbejdsgruppens overvejelser efter en konkret vurdering.
3
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Rapporten vedrører primært digitalisering af kulturarvsmateriale, som foreligger i analog form1,såkaldt retrodigitalisering (i modsætning til digitalt født materiale). Herunder kan der være tale omdigitalisering af registre, kataloger mv. (digitalisering af metadata2) – en aktivitet, der ofte betegnessom retrokonvertering. Dette er en aktivitet, der på de forskellige kulturbevaringsområder ergennemført i varieret, men betydeligt omfang.Der kan også være tale om digitalisering af selve de kulturelle objekter inden for de forskelligematerialetyper, som levende billeder, bøger, arkivalier, lyd mv. På nuværende tidspunkt er denneobjektdigitalisering kun gennemført i begrænset omfang, og det er en beskrivelse af denne opgave,herunder omfang, løsningsmuligheder og formidlingsperspektiver, der er rapportens hovedemne.Rapporten vedrører som nævnt digitalisering af analogt materiale, men når det digitale resultatforeligger, vil dette materiale på de berørte institutioner blive behandlet parallelt med det digitaltfødte materiale, f.eks. i formidlingssammenhæng og i sammenhæng med bevaringsovervejelser.
1.1 KommissoriumUdvalget om digitalisering af kulturarven blev nedsat i oktober 2006 med følgende kommissorium:Kommissorium for arbejdsgruppe om digitalisering af kulturarvenBaggrundSom led i den mediepolitiske aftale for 2007-2010, indgået den 6. juni 2006 mellem regeringen, DF, S,RV og SF, er det aftalt at nedsætte en arbejdsgruppe, der skal udarbejde forskellige forslag tildigitalisering af udvalgte, prioriterede dele af kulturarven.Af den mediepolitiske aftale fremgår:I forlængelse af udredningen om bevaring af kulturarven fra 2003 nedsættes der en bredt sammensatarbejdsgruppe – under Kulturministeriets ledelse – med repræsentanter for de relevante offentligemyndigheder, institutioner og organisationer, som får til opgave at udarbejde forskellige forslag tildigitalisering af udvalgte, prioriterede dele af kulturarven med henblik på bevaring, formidling ogtilgængeliggørelse heraf; herunder digitalisering af DR’s arkiver. I forbindelse med udnyttelsen afmaterialet i arkiverne er det vigtigt at overveje de ophavsretslige problemstillinger. Forslaget skalforeligge i løbet af 2007. Udgangspunktet er, at udgifterne til digitaliseringen af DR’s arkiver afholdesaf DR’s egne midler, inkl. 75 mio. kr. af det forventede licensmerprovenu i årene 2005 og 2006 på i alt150 mio. kr.På den baggrund nedsættes en arbejdsgruppe med nedenstående sammensætning og opgaver.
I enkelte tilfælde er der tale om materiale, der ikke er egentligt analogt, f.eks. DAT-bånd, hvor båndet indeholder digitaltmateriale, men hvor det digitale tekniske format har kort levetid. I disse tilfælde skal der ske en konvertering af materialerne, så desikres med henblik på langtidsbevaring.Metadata er data, der leverer information om andre data, f.eks. et register, hvori en genstand står beskrevet. Registret indeholdermetadata og selve den digitaliserede genstand betegnes som objektet.2
1
4
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Arbejdsgruppens sammensætningArbejdsgruppen skal bestå af én repræsentant for henholdsvis Statens Arkiver, Det KongeligeBibliotek, Statsbiblioteket, Statens Museum for Kunst, Nationalmuseet, Biblioteksstyrelsen,Kulturarvsstyrelsen, Det Danske Filminstitut, DR som repræsentant for public service-institutionerne, Samrådet for Ophavsret og Ophavsretligt Forum, samt ét medlem udpeget af DetStrategiske Forskningsråd, ét medlem udpeget af Forskningsrådet for Kultur og Kommunikation og étmedlem udpeget af it-brancheforeningerne, samt af henholdsvis Finansministeriet,Videnskabsministeriet og Kulturministeriet (formand).Arbejdsgruppen kan beslutte at nedsætte underudvalg, som skal tage stilling til enkelteproblemstillinger som ophavsretlige spørgsmål, spørgsmål relateret til formidling af digitaliseretmateriale mv.Arbejdsgruppen kan beslutte at inddrage ekstern bistand og eksperter i arbejdsgruppens arbejde.Kulturministeriet varetager sekretariatsfunktionen for arbejdsgruppen.Arbejdsgruppens opgaverArbejdsgruppen skal udarbejde forskellige forslag til digitalisering af udvalgte, prioriterede dele afkulturarven. Det overordnede fokus for arbejdsgruppens arbejde og opgaveløsning er bevaring,formidling og tilgængeliggørelse af kulturarven.Formålet er endvidere at fremme samarbejde og sikre en rational arbejdsdeling mellem de involveredeparter nationalt og internationalt.Arbejdsgruppen skal:Som tema have udvalgte prioriterede dele af kulturarven i form af tekst (bøger, tidsskrifter,aviser), fotos, museumsgenstande, arkivalier og audiovisuelt materialeForetage en vurdering af, hvilket ikke digitalt født eller ikke digitaliseret materiale der evt.skal digitaliseres med henblik på bevaring, formidling og tilgængeliggørelse, samt givebegrundelse herforPå baggrund af en bevaringsfaglig, formidlingsfaglig og samfundsøkonomisk bedømmelseoverveje, hvilke selektionskriterier der kan benyttes ved digitalisering af udvalgte prioriterededele af kulturarven og anbefale selektionskriterier til de respektive løsningsmodellerForetage en kortlægning af igangværende og planlagte initiativer vedrørende digitalisering afkulturarven og tilgængeliggørelse herafKoordinere sit arbejde i forhold til andre igangsatte eller påtænkte initiativer med digitaltformidlings- og bevaringsperspektivInddrage internationale erfaringer med digitalisering af kulturarven, i det omfang det skønnesnødvendigtKortlægge ophavsretlige problemstillinger, som knytter sig til digitalisering ogtilgængeliggørelse af kulturarven og, hvis der er behov derfor, fremkomme med løsningsforslagUdarbejde flere forskellige selvstændige, men kombinerbare løsningsmodeller og flereforskellige omkostningsniveauer for digitalisering af udvalgte, prioriterede dele afkulturarven. Arbejdsgruppens forskellige modeller skal indeholde en bedømmelse af omfangetaf digitalisering samt en tidshorisont for de forskellige digitaliseringsmodeller. Mindst én afde overvejede løsningsmodeller skal kunne finansieres inden for kulturarvsinstitutionernes
5
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
ordinære driftsbevillinger. Udgangspunktet er, at udgifterne til digitaliseringen af DR’sarkiver afholdes af DR’s egne midler, inkl. 75 mio. kr. af det forventede licensmerprovenu iårene 2005 og 2006 på i alt 150 mio. kr.Overveje eventuelle lovgivningsmæssige og bevillingsmæssige konsekvenser af de fremlagteforslag.Tekniske overvejelser relateret til bevaring af digitalt materiale håndteres i en allerede nedsatstyregruppe for digital bevaring, der på tværs af arkiver, biblioteker og museer skal samarbejde omden fortsatte udvikling af hensigtsmæssige bevaringsmetoder og -strategier.”
1.2 Udvalgets arbejdeUdvalgets arbejde har i den første fase (2006-2007) primært vedrørt en kortlægning af det stedfundneog planlagte digitaliseringsarbejde på kulturarvsområdet og de bevarings- og formidlingsmæssigehensyn, der ligger bag aktiviteterne. Der er endvidere med bistand af it-analysevirksomheden Gartnerforetaget en vurdering af de omkostninger, der er forbundet med dele af digitaliseringen. Ligeledes erder gennemført en undersøgelse af en række ophavsretlige forhold, der kan læses om i kapitel 7.Den anden fase af udvalgets arbejde (2007-2008) har særlig vedrørt en undersøgelse af dels de faglige,økonomiske og organisatoriske spørgsmål, der knytter sig til prioriteringen af indsatsen, dels detekniske og økonomiske forhold, der er knyttet til spørgsmålet om tilgængeliggørelsen af detdigitaliserede materiale for publikum. Det drejer sig her om en tilgængeliggørelse på en sådan måde,at der skabes det bedst mulige grundlag for en formidlingsaktivitet, der imødekommer mangebrugergruppers behov. It-analysevirksomheden Gartner har også medvirket ved denne del afundersøgelsen.Den tredje fase af udvalgets arbejde (2008-primo 2009) er i høj grad foregået via en nedsatunderarbejdsgruppe og har haft til formål at konkludere på udvalgets hidtidige arbejde ved, via denforeliggende rapport, at fremlægge tre forslag til digitalisering af udvalgte, prioriterede dele afkulturarven.
6
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
2 Udvalgets overvejelserKulturarven er nationens hukommelse. Kulturarvens aktive videreførelse og brug er grundlaget forvor eksistens som en kulturnation. Kulturarven er fundamentet for Danmarks identitet som etvidensamfund og et helt centralt råstof for fremtidens videnøkonomi.Kulturarv kan være et flygtigt begreb, men kulturarven er også helt fysisk og konkret, i form afarkiver, bogsamlinger, pladesamlinger, kunstsamlinger, filmsamlinger, museumssamlinger og megetmere. Kulturarven er således ikke blot fysisk til stede, men har som helt konkret fysisk materiale etovervældende omfang.Det er kulturarvens store omfang, og de deraf følgende muligheder for læring, formidling og forskning,der gør, at kulturarven er enarvog ikke blot et dødt minde om fortiden. Takket være den omhu, somdet danske samfund faktisk i flere hundrede år har udvist med at indsamle og bevare kulturarven, ervor kulturelle arv i dag et materiale langt større, end et menneske kan sætte sig ind i på et helt liv, ogsom vedblivende er en kilde til ny viden, inspiration og råmateriale til kulturel nyskabelse.Men kulturarvens vældige fysiske omfang er naturligvis også en udfordring for den, der vil gøre brugaf den, uanset om brugeren er forsker, uddannelsessøgende eller blot interesseret borger.Kulturarvsgenstandene i samlingerne på arkiver, biblioteker og museer kan være for skrøbelige til athåndtere eller for kostbare til at give fri adgang til, og det er under alle omstændighederressourcekrævende at finde genstandene frem fra store samlinger og arkiver. På den måde er en del afvor fælles kulturarv ofte kun praktisk tilgængelig for dedikerede forskere, og selv for dem kun medstor indsats.Her åbner den digitale formidling et nyt, hidtil aldeles ukendt perspektiv for, hvor mange menneskerder kan få adgang til, og bruge, kulturarven. Når kulturarven digitaliseres, kan den pludselig gørestilgængelig med et museklik og bliver dermed tilgængelig for enhver, døgnet rundt, udenbegrænsninger, i hele landet – ja, principielt hele verden. Digitalisering af kulturarven åbner nyemuligheder for enhver kategori af brugere. Alle vil kunne blive klogere på Danmarks kulturelle oghistoriske arv.For den interesserede borger åbner sig et nyt univers med let adgang til langt mere detaljeret viden ogtil autentiske kilder vedrørende et utal af emner. Det giver stærke kulturelle oplevelser til utalligemennesker og et rigere og mere nuanceret indhold til begreber som national identitet og historiskforståelse. Den særligt interesserede borger fra udlandet, f.eks. den potentielle turist, får også helt nyemuligheder for at erhverve sig et nuanceret billede af Danmark – ikke mindst gennem værktøjer somden nye europæiske kulturarvsplatform Europeana.For den uddannelsessøgende betyder den digitaliserede kulturarv nye læringsoplevelser, med lejlighedtil at omgås et materiale af høj videnkvalitet, som samtidig byder på reel frihed til at gå på opdagelse iet uudtømmeligt materiale, anvendeligt i et utal af undervisningsforløb. Med den digitaliseredekulturarv til rådighed, med dens ægte dybde og detaljerigdom at arbejde med, kan deuddannelsessøgende erhverve sig en helt nygradaf kompetencer i forhold til bearbejdning ogaktivering af nuanceret viden; kompetencer, der er uundværlige for dem, både som mennesker, somborgere og som fremtidige aktører på arbejdsmarkedet.
7
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
For forskeren, der i forvejen bruger kulturarven som råmateriale i sin forskning, kan digitaliseringenofte betyde et kvantespring. Den lette adgang til kilderne, og ikke mindst adgang til søgninger i dempå tværs af materialetyper med ny kombinationsmuligheder til følge, betyder et helt nyt videnniveaufor den enkelte forsker. Det betyder nye muligheder for samarbejde, også på tværs af landegrænser.Hermed kan dansk kulturarv og kilderne til den for alvor træde i karakter som noget, der trækkerudenlandske forskere til samarbejde med danske institutioner og styrker Danmarks placering i denglobale videnproduktion og -formidling.For turisten, eller blot den interesserede netbruger verden over, er den digitaliserede kulturarv etåbent vindue til Danmark som spændende ferieland, gammelt kulturland og moderne, innovativtsamfund med dybe rødder.For den professionelle kulturskaber og den kreative iværksætter er kulturarven, som for forskeren, etuundværligt råstof. Men for den nyskabende betyder digitaliseringen et endnu større løft tilkulturarvens værdi, for letheden af den digitale formidling giver iværksætteren mulighed for hurtigtat skabe helt nye produkter på nettet.
2.1 Formål med digitalisering af kulturarvenKulturarvsinstitutioner kan digitalisere materiale med flere formål – først og fremmest bevaring,beskyttelse og tilgængeliggørelse3. Med beskyttelse menes det værn mod slid, uheld og tyveri, somligger i, at originalmaterialet ikke længere behøver håndteres ved brug. Mens beskyttelse ogtilgængeliggørelse meget ofte går hånd i hånd, så er det kun en mindre del af kulturarvsmaterialet,hvor der er behov for egentlig bevaringsdigitalisering.Størstedelen af kulturarvsmaterialet er, med den rette opbevaring og håndtering, i en sådan stand, atdet ikke er akut nødvendigt at tage skridt til digital bevaring. For andre materialer er digitalisering ibevaringsformat endnu ikke teknisk og ressourcemæssigt praktisabel (det gælder eksempelvis film påfilmruller).Der er dog også en række kulturarvsmaterialer, der allerede på nuværende tidspunkt befinder sig i entruet tilstand, eller som i det hele taget er meget besværlige og ressourcekrævende at bevare iorignaltilstanden. Det er særligt audiovisuelt materiale, dette gør sig gældende for. Der er tale om lydog levende billeder i et stort antal formater, på mange forskellige typer fysiske medier, som det byderpå store vanskeligheder at bevare, både fordi medierne i sig selv er skrøbelige, og fordi udstyret til atafspille dem på udgår – eller allerede er udgået – af almindelig handel.Bevaringsmæssige problemer eksisterer imidlertid også for andre materialer. Det gælder ikke mindsttrykte materialer, der ikke i udgangspunktet er produceret med henblik på langtidsbevaring – aviser,blade, småtryk mv. Samtidig er dette materialer, der netop i kraft af, at de er skabt med henblik påøjeblikkeligt ”forbrug”, er kulturarvsmæssigt unikke, fordi de giver et dag til dag-billede af historien.
Institutioner kan tillige digitalisere med henblik på interne arbejdsprocesser. Dette hensyn ligger dog uden for udvalgetsovervejelser.
3
8
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Selvom bevaringshensynet således ikke er negligerbart, når man skal prioritere indsatsen pådigitaliseringsområdet, så overskygges det alligevel af hensynet til tilgængeliggørelsen. Hvor storedele af kulturarven med den kendte teknologi bedst og billigst lader sig bevare i original form (somman selvfølgelig normalt også foretrækker at bevare, såfremt det er muligt), så vil en digitaltilgængeliggørelse betyde et stort spring i borgernes mulighed for hurtig og nem adgang.Derfor er dette også det afgørende fokus i udvalgets forslag til prioritering af digitaliseringen. Der er ihøj grad taget udgangspunkt i materialer, hvor man af erfaring ved, at der er stor potentielefterspørgsel, men hvor det er kompliceret at få adgang til originalmaterialet: arkiver, kortsamling,billedsamlinger, småtrykssamlinger, Statsbibliotekets samling af danske aviser mv. Der er tale ommaterialekategorier, der er samlet ét sted, og hvor søgning, bestilling og fremfinding i dag er besværligog langsommelig, mens brugstiden ofte er kort, fordi brugeren måske blot har behov for at finde enenkelt reference. Et oplagt eksempel er kirkebøger, hvor folk med interesse for slægtsforskning ofteblot skal bruge én oplysning fra en given kirkebog. Det er materialer, der i digitaliseret form kanbruges på helt nye måder og i helt nye sammenhænge.Det Kongelige Biblioteks store nationalbibliotekssamling, der omfatter al trykt litteratur udgivet iDanmark og om Danmark siden 1482, er derimod ikke prioriteret, selv ikke i den mest ambitiøsemodel. Det skyldes dels omfanget, dels at der er nem adgang til de fysiske eksemplarer gennem etfunktionelt system for tilgængelighed af bøger med et rimeligt forhold mellem fremfindingstid ogbrugstid for det enkelte materiale, hvorimod en lang række andre samlingstyper med digitaliserings-teknologien for første gang kan gøres reelt tilgængelige for offentligheden.Samtidig skal man, jf. afsnit 2.2 nedenfor, se den relativt lave prioritering af bogsamlingerne i lyset af,at store dele heraf typisk er omfattet af ophavsret og dermed relativt kostbare at stille til rådighed,ligesom man kan antage, at en hel del vil blive tilgængeliggjort digitalt af de kommercielle aktører.Det skal dog understreges, at digitaliseringen også for bibliotekssamlingernes vedkommende gør enafgørende forskel i tilgængelighed og interesse (jf. faktaboks nedenfor), og på sigt er der næppe tvivlom, at digital tilgængelighed er forudsætningen for, at den danske litterære arv kan blive levende,også i den digitale tidsalder. Der er ingen tvivl om, at udvalgte dele af de ældre samlinger alleredeinden for rapportens tidshorisont om muligt burde digitaliseres, såfremt der opstår økonomisk rumhertil.Det drejer sig først og fremmest om de store viden-, kilde- og tekstkorpera, der ligger i faglitterærereferenceværker, de centrale faglige og videnskabelige tidsskrifter, historiske og juridiskekildesamlinger, dokument- og brevudgaver samt evt. samlingsdele, der understøtterdigitaliseringsinitiativer inden for andre materialetyper. Det er samlinger, der, jf. ovenfor, normalt erkarakteriseret ved stort tidsforbrug til fremfinding og ofte relativt kort brugstid.Generelt skal det bemærkes, at eftersom scenarierne i det følgende alle er bygget op om en tiårigperiode, vil det utvivlsomt blive nødvendigt med tilpasninger og konkrete omprioriteringer undervejs.Der kan vise sig udviklinger i teknologien, eller der kan melde sig private samarbejdspartnere, somkan betyde, at andre materialesamlinger pludselig viser sig mere lovende at digitalisere. Deindhøstede erfaringer, både fra selve digitaliseringen og fra den efterfølgende brug af materialet, kanogså betyde nødvendige omprioriteringer.
9
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Faktaboks:Hidtidige erfaringer med digital tilgængeliggørelseStyrelsen for Bibliotek og Medier har i Folke- og Forskningsbiblioteksstatistik 2007 set på forskelligeudviklingstræk i de 16 største forskningsbiblioteker. Det fremgår heraf, at antallet af fysiske udlåneksklusive fornyelser har været faldende i perioden fra 2000 til 2007. I samme periode er deelektroniske ”udlån” (download) vokset med 750 %, således at de herefter udgør næsten 12 millioner.Fra 2002 har man opgjort antallet af download på interne og eksterne servere. Eksterne servere giveradgang til betalingsbelagte materialer, især tidsskrifter, medens materialer på interne servereovervejende er genereret af bibliotekerne og deres moderinstitutioner. Omfanget af download fraeksterne servere er steget med 181 % siden 2002, medens omfanget af download fra interne servere ersteget med 406 %. Det er altså især tale om en kraftig vækst i antallet af download fra institutionernesegne digitale data.For Det Kongelige Biblioteks vedkommende stiger antallet af download fra egne servere fra knap540.000 i 2002 til godt 1,4 millioner i 2007, medens antallet af eksterne download stiger fra 0,7 milliontil 2,4 millioner i samme periode.For Statsbibliotekets vedkommende stiger antallet af interne download fra knap 65.000 i 2002 til knap780.000 i 2007, medens de eksterne stiger fra 0,6 million til 1,4 millioner. Det kan altså konstateres, atder er en meget stor efterspørgsel efter digitale data, ikke mindst fra bibliotekernes egnedigitaliseringer.For Statens Arkivers vedkommende kan nævnes, at antallet af registrerede bruger af Arkivalieronlinesteg fra 8.262 i 2004 til 96.216 ved udgang af 2007 og 113.280 ved udgangen af 2008. Der blev fraArkivalieronline.dk i 2007 foretaget eksterne download af 105 mio. sider; i 2008 steg dette tal til over151 mio. sider. Arkivalieronline har i gennemsnit ca. 4.500 unikke besøg om dagen. DanskDemografisk Database, der drives af Statens Arkiver, havde i 2008 i gennemsnit ca. 5.000 unikkebesøg om dagen.
2.2 Tilgængeliggørelse af digitaliseret materialeUdvalgets forslag til digitalisering af kulturarven, som er skildret i de følgende kapitler, er bygget opomkring det helt centrale spørgsmål for en digitaliseringsplan – nemlig hvilket udsnit af det enormeeksisterende kulturarvsmateriale der skal prioriteres digitaliseret4. Men herefter skal brugernenaturligvis også have adgang til den digitaliserede kulturarv.Udvalget skal dog også pege på en række tekniske og organisatoriske forhold, der skal være på pladsfor at danne grundlag for digitalisering og tilgængeliggørelse af det udpegede materiale. For enuddybning heraf henvises til Bilag: Teknisk redegørelse vedr. digitalisering af kulturarven.
Til udvalgets midtvejsrapport fra september 2008 (www.kum.dk/sw75986.asp) foretog it-konsulenterne Gartner en analyse, derviste, at en digitalisering af alt digitaliseringsværdigt materiale på kulturarvsinstitutionerne ville koste mellem 2 og 3 mia. kr. medden kendte teknologi.
4
10
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Forudsætningerne er:En effektiv og konsolideret proces for selve digitaliseringen, så resultatet faktisk bliverbrugbare digitale filerEn pålidelig og langtidsholdbar bevaring af de digitale filerEn konsekvent anvendelse af internationalt anerkendte standarder for filer og metadata, såmaterialet kan søges og anvendes på flest mulige platformeEksponering af materialet, dvs. at det kan ”ses” af søgemaskiner som Google og Europeana.Effektiv eksponering kræver sandsynligvis, at der også laves en struktur for indsamling afmetadata.Disse forudsætninger kan forekomme indlysende og bør også være indlysende rettesnore i arbejdet.Når det alligevel skal fremhæves her, er det fordi man i praksis har set flere internationale eksemplerpå, at man i konkrete digitaliseringerikkehar fået opfyldt forudsætningerne.At opfylde forudsætningerne er således ikke selvfølgeligt, men vil kræve en infrastruktur mellemkulturarvsinstitutionerne, der sikrer, at de kompetencer, der allerede findes blandt institutionerne,kommer alle institutionerne til gavn, og at man anvender fælles standarder og procedurer. I dentekniske redegørelse peger udvalget derfor påmuligheden forat oprette egentlige kompetencecentrefor de enkelte materialetyper.Det kan også blive relevant med en fælles bevaringsinfrastruktur og som minimum en fællesindsamling af metadata, som kan sikre, at materialet bliver søgbart og tilgængeligt på tværs afinstitutioner – dvs. som minimum et ”virtuelt” datawarehouse, gennem hvilket man kan fremsøge ethvilket som helst digitaliseret materiale fra kulturarvsinstitutionerne.Bilag 2 indeholder en analyse af udgifterne til en minimal infrastruktur baseret på et fælles lager. Desamlede udgifter er estimeret til 10,5 mio. kr. årligt. Estimatet for den samlede infrastruktur erudarbejdet under forudsætning af opbygning af en fælles infrastruktur og en vis mængde digitaliseretmateriale. Infrastrukturen vil være relevant i forhold til scenarie 2 og 3.Udgangspunktet for estimatet er en lagerstørrelse på 2500 TB, svarende ca. til scenarie to. Et fuldtudfoldet scenarie 2 vil således indebære udgifter på ca. 10 mio. kr. årligt, mens et fuldt udfoldetscenarie 3 vil indebære udgifter på 10-15 mio. kr. årligt. Det skal bemærkes, at estimeringen afdriftsudgifterne bygger på et worst case-scenarie, idet prognoserne for omkostningen til lagringen afTB er meget usikre.Det bemærkes som nævnt, at udgiftsskønnet er foretaget ud fra et fælles lager. Som det fremgårovenfor, er et fælles lager ikke en forudsætning for at etablere søgbarhed på tværs, og udvalget ser sigikke på det foreliggende grundlag i stand til at vurdere, om et fælles lager faktisk er den optimaleløsning, og kan således ikke komme med nogen anbefaling herom.Men med de i bilaget nævnte forbehold angående økonomiskønnet kan det dog konkluderes, at derfindes i hvert fald én mulig løsning omkring bevaring og tilgængeliggørelse inden for de i scenarierneangivne økonomiske rammer, og at scenarierne således lader sig realisere som beskrevet.
11
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
I en konkret planlægningssituation vil det så kræve en mere grundig overvejelse, om et fælles lager erden optimale løsning, eller der kan peges på bedre, decentrale muligheder.Infrastrukturen vil omfatte lagring og tilgængeliggørelse af det digitaliserede materiale. Den viltilbyde tværgående søgning i metadata fra materialerne og understøtte eksisterendeformidlingsinitiativer.Den beskrevne infrastruktur er baseret på en større mængde digitaliseret materiale og vil derfor få enanden udformning i forhold til scenarie 1. Infrastrukturen for scenarie 1 vil hovedsagligt bestå istandardisering af metadata og eksisterende systemer, således at det bliver muligt at høste metadataog eksponere dem for andre systemer. I scenarie 1 vil metadata blive høstet og gjort tilgængeligt forsøgning i en fælles national base og blive eksporteret til Europeana.
2.3 OphavsretEn betydelig del af det materiale, som kulturarvsinstitutionerne ligger inde med, er fortsat omfattet afophavsret. Dette materiale er normalt det nyeste og oftest det mest attraktive for brugerne, og detunderstreges ofte, hvor væsentligt det er, at der ikke i tilgængeliggørelsen af kulturarven bliver etsåkaldt ”sort hul i det 20. århundrede”, som kan medvirke til at fremmedgøre store grupper over forkulturarvens tilbud.Danmark er på dette område langt fremme, idet Folketinget i foråret 2008 vedtog en udvidelse afmulighederne for brug af de såkaldteaftalelicenser(lov nr. 231 af 8. april 2008)5. Denne ordningreducerer i høj grad de administrative omkostninger ved digital tilgængeliggørelse afophavsretsbeskyttede materialer.Disse regler giver et stærkt udgangspunkt for, at kulturarvsinstitutionerne kan formidle ogsåophavsretsbeskyttet materiale fra deres samlinger. Der findes allerede en række kanaler, der kunnevære velegnede til formidling af sådant materiale, f.eks. e-museum.Det er samtidig et område, hvor der tegner sig potentiale for samarbejde mellemkulturarvsinstitutioner og private virksomheder om at stille de fulde samlinger til rådighed i enkombineret offentlig/privat løsning (et godt eksempel er et kommende samarbejde mellemStatsbiblioteket og en privat udbyder om tilgængeliggørelse af Statsbibliotekets samling af danskeaviser, se faktaboks nedenfor side 25).Aftalelicensordningen ændrer dog ikke ved, at tilgængeliggørelse af ophavsretsbeskyttede materialermedfører væsentlige omkostninger for brugere og/eller institution, som ikke optræder, hvis materialetikke er omfattet af ophavsret, eller hvis institutionen selv er indehaver af den fulde ophavsret.
En aftalelicens er en tilladelse til, at en organisation kan indgå aftale på vegne af rettighedshaverne til en bestemt art af værker.Sådanne organisationer skal være repræsentative for de berørte rettighedshavere og vil typisk være forvaltningsselskaber som f.eks.Copydan. Dette betyder, at en kulturarvsinstitution i forbindelse med digitalisering kan indgå aftaler om ophavsret med énorganisation, hvor de ellers ville have skullet indgå aftaler med tusindvis af individuelle ophavsretshavere.
5
12
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Derfor skal man i forhold til digitaliseringsforslagene i de følgende kapitaler være opmærksom på, athensynet til sådanne omkostninger har væsentlig betydning for, hvilket materiale der peges på tildigitalisering, og en række valg og fravalg må forstås i lyset heraf.Det skal også bemærkes, at omkostningerne ved tilgængeliggørelse af ophavsretsbeskyttet materialeafhænger af en konkret forhandling, og at det derfor i beskrivelsen af de enkelte scenarier kan værevanskeligt præcist at angive, hvor bredt det kan tilgængeliggøres. Som nævnt ovenfor kan det dogvære muligt i sådanne tilfælde at finde kommercielle samarbejdspartnere, der kan gøre materialettilgængeligt for den brede offentlighed mod vederlag.
2.4 FormidlingDet er udvalgets opfattelse, at hovedopgaven for en national plan for digitalisering af kulturarven måvære at sikre, at materialet digitaliseres og gøres reelt tilgængeligt. Dette indebærer, jf. afsnit 2.2,også formidling i form af f.eks. produktion af metadata, der kan eksponere materialet i gængsesøgemaskiner.I forhold til forslag 3 (se afsnit 2.5) kunne det ydermere overvejes at få udarbejdet en form forengelsksproget indholdsoversigt til samlingerne med henblik på at skabe interesse hos udenlandskeforskere for samarbejde med danske forskere om brug af danske kilder. Uden et sådant redskab kandet blive svært for potentielle internationale samarbejdspartnere at danne sig et overblik over,hvorvidt der er interessante muligheder. Ideelt burde samlingernes metadata være søgbare på engelsk,men muligheden herfor inden for de økonomiske scenarier afhænger af den teknologiske udvikling iforhold til automatisk oversættelse af metadata.Spørgsmålet om formidling er naturligvis helt afgørende for den faktiske værdi af materialet forbrugerne, men antagelsen må være, at det afgørende er at samordne den tværgående brugbarhed,mens formidlingen trives bedst med decentraliseret initiativ og kreativitet, skabt af institutioner,brugere og private virksomheder.Derfor er fokus også flyttet fra tanken om en samlet portal, som tidligere har været fremme i udvalgetsarbejde. Denne tanke var desuden i midtvejsrapporten forbundet med anbefalingen af at opbygge enkapacitet til integreret søgning, dvs. søgning via indeksering af filernes indhold og ikke blot via deresmetadata (det man også kunne kalde fuldtekstsøgning).Som teknologien er i dag, er det imidlertid vanskeligt at arbejde med sådanne søgninger i andet endnetop tekst, og da vægten i udvalgets prioritering i sidste ende i højere grad er blevet lagt på andretyper materiale (billeder, lyd, levende billeder), er relevansen af at etablere en portal med integreretsøgning også formindsket.Der findes også allerede forskellige sektorspecifikke portaler til formidling til bestemte brugergrupper,f.eks. EMU og herunder e-museum, rettet mod bl.a. grundskoler og ungdomsuddannelser, som der kansamarbejdes med.Udvalget har valgt at fremhæve forskellige eksempler på mulige formidlings-værktøjer, som kunnetage udgangspunkt i det tilgængeliggjorte digitale kulturarvsmateriale i de forskellige scenarier. Men
13
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
det afgørende fokus for udvalget har været selve digitaliseringen og tilgængeliggørelsen.Formidlingseksemplerne skal således alene ses som eksempler.Faktaboks:Et afprøvet formidlingsredskab – danskkulturarv.dkwww.danskkulturarv.dkgik syv af Danmarks store kulturinstitutioner sammen om (bl.a.) enundervisningscase på tværs af institutioner, samlinger, tid og rum, hvor man ønskede ateksperimentere med, hvordan den fælles kulturarv kan understøtte undervisning og indlæring ifolkeskolerne. Alle syv institutioner bidrog med digitale materialer såsom billeder, video, tekst og lyd,udvalgt på baggrund af et bestemt tema. Der er i princippet ingen begrænsninger i temaer ellertilrettelæggelse af grænseflader, hvis der ligger nok digitaliseret materiale til grund.Grundtanken var at bygge undervisningen op omkring onlineaktiviteter som eleverne kender fra deresfritid. Der blev derfor udviklet en undervisningsgrænseflade efter inspiration fra bl.a. iTunes og flickrsmange interaktive muligheder, hvor man kan ”tagge” materiale, tilføje egne beskrivelser, læse andresbeskrivelser, sammensætte egne samlinger (playlister) af udvalgt materiale samt lade sig inspirere afandres playlister. Derudover blev en lille håndfuld kendisser, som eleverne ville kunne relatere til,bedt om at lave en playlist til inspiration og opdagelse for eleverne.Sammen med undervisningskonsulenter blev der tilrettelagt tre onlineundervisningsforløb for at gøredet let for lærerne at inddrage forløbene i deres undervisning. Hvert undervisningsforløb indeholdtopgaver og spørgsmål, som skulle besvares af eleverne vha. materiale fra hjemmesiden. Envidereudvikling af ideen kunne omfatte muligheden for, at lærerne selv udvikler nyeundervisningsforløb og lægger dem ud til fælles brug, eller eksport af indholdet ud i andregrænseflader, så det kan genbruges og mikses på nye måder.For nærmere beskrivelse, download af undervisningsmateriale samt brugerundersøgelse, se:www.danskkulturarv.dk(hjemmesiden er fortsat åben, men ikke længere aktiv).
2.5 Baggrund for udvalgets forslagI de følgende tre kapitler skitseres tre forskellige forslag fra udvalget til, hvilke dele af kulturarvenman, under forskellige økonomiske forudsætninger, kan prioritere at digitalisere.De tre forslag bygger oven på hinanden, i den forstand at forslag 3 også indeholder materialet i forslag2, som igen indeholder materialet i forslag 1. Udvalget har med forslagene valgt at tage udgangspunkti tre forskellige ambitionsniveauer, dvs. i tre forskellige niveauer for statslig økonomisk indsats påområdet.Udvalget skal bemærke, at der er stordriftsfordele i selve arbejdsprocesserne omkring digitalisering,ligesom tilgængeligheden af en ”kritisk masse” af samlinger har betydning for borgernestilfredsstillende brug af materialet, hvorfor der både hvad angår kvalitet og kvantitet er et stort springi resultat fra forslag 1 til forslag 2 og igen fra forslag 2 til forslag 3.
14
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Det første forslag kan, i overensstemmelse med udvalgets kommissorium, finansieres inden forinstitutionernes ordinære bevillinger. Udvalget har med forslag 2 og forslag 3 valgt at se på nogleforholdsvis ambitiøse økonomiske scenarier, hvortil udgifterne udgør henholdsvis i alt 300 mio. kr. og570 mio. kr. i perioden 2010-2019, inkl. udgifter til tilgængeliggørelse. Man kan ikke på et fagligtgrundlag pege på ét rigtigt ressourcemæssigt ambitionsniveau; det er et politiskprioriteringsspørgsmål.Afklaringen af finansieringen af udgifterne til gennemførelsen af forslag 2 og forslag 3 udestår, men vilskulle overvejes i sammenhæng med valg af model.De økonomiske scenarier såvel som tidshorisonten skal naturligvis ses på baggrund afdigitaliseringsopgavens væsentlighed og store omfang, jf. midtvejsrapportens analyse af det samlededigitaliseringspotentiale. Således skal man være opmærksom på, at man selv i den mest ambitiøsemodel kun kan håndtere en delmængde af det samlede digitaliseringspotentiale, og at mange ting ikkevil kunne indbefattes (f.eks. fag- og skønlitteraturen, jf. ovenfor).Samtidig skal man være opmærksom på den store indsats, der foregår i mange lande, ikke mindst deengelsksprogede. Indsatsen i f.eks. USA skal selvfølgelig ses i forhold til landets størrelse og foregår ihøj grad via kommercielle aktører som eksempelvis Google.Men også i europæiske lande sker der en indsats. Norge har eksempelvis påbegyndt en digitaliseringaf den samlede trykte nationallitteratur. Frankrigs nationalbibliotek har indledt et program, der skaldigitalisere 150.000 trykte bog- og tidsskriftsenheder om året (komparativt svarende til 15.000enheder om året i Danmark). Og Nederlandene har afsat i alt 170 mio. euro til digitalisering afaudiovisuelle arkiver (film, tv og radio).Der kan være en risiko for, at dansk kulturarv i både synlighed og brug bliver marginaliseret i forholdtil engelsksproget (og anden fremmedsproget) kulturarv på nettet, også for danske brugere, mednegative konsekvenser for dansk sprog og identitet, dansk kulturproduktion og innovation og danskforskning inden for samfundsvidenskabelige, humanistiske og æstetiske fag.
15
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Faktaboks:KulturPerler – ny national portal, der beskriver og registrerer digitaliserede ressourcerog samlinger i DanmarkEr de unummererede betænkninger i Danmark digitaliserede? Hvad er der digitaliseret, der kunne værerelevant for min undervisning i faget historie eller dansk i gymnasiet? Er der noget i naturvidenskab?Hvem har digitaliseret noder? Hvilke danske fagtidsskrifter kan findes online? Hvad har DanskFolkemindesamling digitaliseret? Disse og lignende spørgsmål har været svære eller umulige at svaresikkert, udtømmende og autoritativt på indtil nu, eftersom de ikke kan besvares inden for voretraditionelle katalogbaser, registre og søgesystemer, bl.a. fordi en fast katalognorm kun findes påbiblioteksområdet.Som første resultat af Kulturministeriets arbejde med en planlægning af digitalisering af kulturarvengiver Det Kongelige Bibliotek på sin hjemmesidewww.kb.dkfra 2009 adgang til”KulturPerler”en heltny digital, nationalbibliografisk tjeneste,der har til opgave atbeskrive og registrereden digitaliseredekulturarv i Danmark, dvs. ressourcer og samlinger af alle arter, efterhånden som disseretrodigitaliseres.Tjenesten er tværsektoriel og -institutionel og omfatter, hvad der erretrodigitaliseret af både biblioteker, arkiver, museer og andre institutioner, f.eks. Det Danske Sprog-og Litteraturselskab, Kort- og Matrikelstyrelsen og Danmarks Radio. Det er den første af sin artinternationalt set, og konceptet har allerede vakt interesse i udlandet.”KulturPerler.kb.dk” sigter på at give både et overblik over digitaliseringssituationen i Danmark ogsystematiske, faktuelle oplysninger om de enkelte digitaliserede samlinger. Det Kongelige Bibliotekhar stået for udarbejdelsen i samarbejde med de relevante institutioner, men fremover skal tjenestenvære interaktiv, i den forstand at institutioner, personer eller organisationer, der digitaliserer eller eransvarlig for digitalisering, skal kunne indberette (selvangive) til tjenesten i et fast format medbeskrivelsesforslag til enbeskrivelsesdelog oplysninger til enkatalogdel.Det endelige redaktionelleansvar ligger dog hos Det Kongelige Bibliotek.Første del, oversigterne, sigter især pådet politisk-administrativeniveau, brugere/borgere og fagfolk,der vil have et overblik over,hvadder er digitaliseret i Danmark i enteninstitutioneltregi, ud fra enfagligeller enmaterialetypologisksynsvinkel, mens anden del, katalogdelen, sigter på de sædvanligebrugere af bibliotekernes ressourcer, herunder bibliotekarer m.fl.En sådan fortegnelse, der kan give såvel overblik som systematiske oplysninger om den enkeltedigitaliserede samling, findes ikke i dag og falder uden for rammerne af de eksisterendenationalbibliografiske fortegnelser, biblioteks-, museums- og andre institutionskataloger. Den skalvære instrumentet til at følge med i udviklingen af digitaliseringssituationen i Danmark, der i deforløbne år har fået flere betegnelser i den offentlige debat, f.eks. "dansk på nettet", "kulturarven pånettet" mv. Fortegnelsen skal i første omgangikkeomfattedigitalt fødte,herunder kommercielt produ-cerede og publicerede, ressourcer.”KulturPerler.kb.dk” skal således omfatte både allerede digitaliseret kulturarvsmateriale og fremtidigdigitaliseringsindsats, både i form af massedigitalisering og selektiv digitalisering uanset form ogbegrænsninger i Danmark. Allerede nu indgår ca. 170 samlinger af meget forskellig størrelse.
16
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
3 Forslag 1
3.1 Udvalgets forslagInden for de økonomiske rammer, som sættes af institutionernes ordinære bevillinger, foreslårudvalget digitalisering af nedenstående materialer i perioden 2010-196:Trykte tekster, arkivalier, håndskrifter mv.20.000 tekstsider fra artikel- og dokumentsamling (DFI), som belyser dansk filmhistorie, ogsom kan bruges af både uddannelsessøgende, interesserede borgere og forskere somkontekstmateriale for instituttets øvrige samlinger.Folketællingsskemaer (ca. 4 mio. sider) fra tællingerne i 1901, 1906, 1911, 1921 og 1925 ogkirkebøger 1925-1960 (ca. 2 mio. sider). Materialet er relevant for såvel demografiske somregionale og lokale studier, hvad enten udgangspunktet er en lokalitet eller en population. Derer tale om komplette digitaliseringer med meget brede anvendelsesmuligheder for forskere.Samtidig er materialet stærkt efterspurgt af den meget store gruppe af slægtsforskere. Dedigitaliserede kirkebøger og folketællinger, der allerede findes på arkivalieronline.dk,tiltrækker dagligt 4.-5.000 unikke besøg.370.000 avissider fraAdresseavisen1759-1909 (SB). En digitalisering vil gøre detteefterspurgte materiale bedre tilgængeligt for forskere og tilgængeligt i det hele taget forkulturinteresserede borgere, ligesom det har oplagte anvendelsesmuligheder i enundervisningssammenhæng.93.000 sider atlas, musiktidsskrifter, teaterprogrammer og småtryk (KB). Der er tale om etmateriale, der i analog form er besværligt at finde frem, men som fra talrige vinkler giver etgodt billede af tilværelsen i Danmark gennem årene. Inden for rammerne af forslag 1 bliverder tale om et relativt begrænset udpluk, der kan hæmme den forskningsmæssige værdi, meninteressen for den almindelige borger og værdien i en undervisningssituation vil værebetydelig.110.000 sider manuskripter og breve mv. (KB). Ligesom med småtryk er der tale om etmateriale, som kan være besværligt at bruge i analog form, men som i alment tilgængelig formkan have stor interesse i mange sammenhænge.Billeder50.000 stills fra danske film (DFI); digitaliseres løbende (bl.a. efter forespørgsel). Billedernegøres tilgængelige både i lav opløsning frit på internettet og i høj opløsning via
Oplysningerne vedr. DR’s samlinger angår dog den indeværende medieforligsperiode 2007-10, hvor DR har en særliglicensbevilling på 75 mio. kr. til digitalisering.
6
17
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
betalingsservice, til professionelle brugere som medier og forlag mv. Billederne vil blivedigitaliseret i fuld bevaringskvalitet.20.000 stills fra danske kort- og dokumentarfilm (DFI); digitaliseres løbende, især ud af dencentrale samling fra statslige producenter (Statens Filmcentral mv.). Den digitale samling afstills kan f.eks. i forhold til undervisningssektoren virke som supplement til brugen af kort- ogdokumentarfilm i undervisningen (eksempelvis som råstof til elevproduceret materiale),ligesom samlingen også kan være relevant for forskere (i denne model er der dog kun tale omen del af samlingen på ca. 64.000 stills fra kort- og dokumentarfilm, hvorfor forskere fortsatvil være nødt til i høj grad at bruge de analoge faciliteter).Udvalgte udpluk af Bygningsfredningsarkivet og Arkivet over Fredede Fortidsminder (KUAS).Der er tale om Kulturarvsstyrelsens arbejdsarkiv, som rummer en enestående dokumentationaf historiske bygninger og lokaliteter i Danmark. Inden for rammerne af forslag 1 vil derkunne digitaliseres et mindre udvalg af materiale, primært kort, tegninger og billeder, som ermest interessant formidlingsmæssigt, og som også er det mest bevaringsmæssigt udsatte.15.000 af Den Kongelige Kobberstikssamlings værker (SMK – i øjeblikket mangler 218.000 afsamlingens i alt 245.000 værker at blive digitaliseret). Der er tale om museets i internationalmålestok bedste og mest efterspurgte samling. Digitalisering af 15.000 værker viltilgængeliggøre mindre, udvalgte dele af samlingen for offentligheden, mindske slitage pånogle af de mest efterspurgte værker og samtidig gøre de mest efterspurgte dele af samlingeninternationalt tilgængelige, til gavn for museets placering i internationaleforskningssammenhænge (se også faktaboks side 27).52.000 fotografier (KB). Det Kongelige Bibliotek er nationalbibliotek for fotografier og liggerdermed inde med fotos i en lang række kategorier. Inden for rammerne af forslag 1 er der taleom et udpluk, som ikke desto mindre kan give et indblik i en lang række historiske,geografiske og samfundsmæssige emner til stor interesse for den almindelige borger.50.000 billeder fra analoge billedsamlinger (NATMUS). Billederne er overvejende topografiskeog stammer fra museets forskellige arbejdsområder. Både billeder af museumsgenstande,ekspeditionsbilleder fra f.eks. Thuleekspeditionerne og kulturhistorisk dokumentation fraf.eks. Købstadsundersøgelserne vil blive digitaliseret som punktnedslag.1.000 billeder om Jellingmonumentets historie (NATMUS). I forbindelse med forsknings- ogformidlingsprojektetJellingprojektet – et kongelige monument i dansk og europæisk belysningdigitaliserer NM de gamle analoge billeder, som ikke blot viser de arkæologiske udgravninger,men også monumenternes rolle som besøgsmål og nationalt mindesmærke.5.000 optagelser af museumsgenstande fra Danmarks Oldtid (NATMUS). Genstandene ersåkaldte ENB-genstande (enestående national betydning), og ca. 10 % af billederne vil bliveoffentliggjort på museets hjemmeside som 3D-genstande, dvs. som billeder, der kan roteres ogzoomes. På den måde vil både forskere og den almindelige kulturinteresserede person på nærthold kunne opleve oldtidens håndværksmæssige kunnen.
18
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Kalkmalerier i 327 af landets sognekirker (NATMUS). Formålet med projektBevaringsplanfor kalkmalerier i de danske kirkerer at skabe et styringsredskab i form af en database, somgiver et samlet overblik over kalkmaleriernes bevaringstilstand. Målgruppen er primært dekirkelige myndigheder med ansvar for restaurering; men databasen vil også være interessantfor alle, som er interesseret i den enestående kulturarv, som kalkmalerierne i de danskekirker repræsenterer, idet det vil være muligt at søge f.eks. på motiv. Omfanget svarer til ca.30 % af samtlige danske kirkers kalkmalerier.
Musik og lyd15.000 pligtafleverede cd’er (SB). Der er tale om løbende digitalisering af indkomnematerialer, som i overensstemmelse med internationale anbefalinger for bevaring af cd’er skalsikres allerede ved modtagelsen pga. mediets ringe holdbarhed. Der er derfor primært tale omdigitalisering med henblik på at bevare den komplette samling for eftertiden. En del af denefterspurgte nyudgivne musik bliver under alle omstændigheder gjort digitalt tilgængelig påkommercielle vilkår. Men tilgængeliggørelse af den fulde musiksamling, herunder også denmere smalle musik, vil være relevant, eksempelvis i en udbygning af Netmusik.dk, og kanhåndteres inden for de nye regler om aftalelicens.3.000 pligtafleverede lydbøger (SB). Der er tale om både løbende afleveringer og omindhentning af efterslæb i digitaliseringen. Ligesom hvad angår musik-cd’er, er der tale om enhøj prioritet i bevaringshenseende, med henblik på at bevare en komplet samling foreftertiden.600 unikke danske voksvalser med privatoptagelser fra perioden 1900-1930 (SB). Der er taleom et mindre, men interessant materiale fra lydmediets barndom i Danmark, der i sinnuværende form er utilgængeligt for formidling, da der er tale om skrøbelige fysiske medier,som kræver helt specielt afspilningsudstyr.4.000 dialektoptagelser, primært spolebånd (SB). Et bevaringsmæssigt truet materiale, dererfaringsmæssigt har meget stor interesse blandt den almene befolkning, og som også harmeget stor relevans både i uddannelsessituationer og for forskere, og som vil kunne stilles tilrådighed via en aftale efter den nye aftalelicensordning.
19
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Formidlingseksempel:Dialektoptagelser i undervisningenDet danske sprog er under konstant forandring. I dag går udviklingen endog meget hurtigt. Der erbekymring for, om det danske sprog overlever, i lyset af mediernes påvirkning og globaliseringen.Det har sat fokus på nødvendigheden af at styrke danskundervisningen og give eleverne en forståelseaf det danske sprogs historie. Dansk er et mangfoldigt sprog med mange dialekter, og hver dialekt harknyttet sin egen kulturhistorie til sig.Hvordan talte man i gamle dage i Sønderjylland og på Bornholm? Og hvorfor talte man lige sådan?Det kan man få svar på ved at høre de dialektoptagelser, som Statsbiblioteket i samarbejde medKøbenhavns Universitet og Aarhus Universitet ønsker digitaliseret og stillet til rådighed for forskningog undervisning. Optagelserne dækker dialekter fra hele landet med eksempler på, hvordan folk, derer født i begyndelsen af 1900-tallet, talte. Det er hverdagen i gamle dage, der fortælles om, og vi fårderfor også et indblik i livsvilkårene dengang.
Kilde: dialekt.dkVed klik på et Danmarkskort kan eleverne samtidig med at de lytter til dialekten klikke videre tiluddybende forklaringer på de enkelte egnes dialekttræk og karakteristika.3.300 musikoptagelser med uropførelser af ny dansk kompositionsmusik og jazz fra perioden1979-2002 (SB). En unik samling med stor potentiel værdi for musikforskere og evt. viasamarbejde med kommercielle partnere også for almindeligt musikinteresserede.54.000 sider noder (KB). Med tværgående søgning kan udpluk af nodesamlingen have storværdi i samspil med samlinger af musik for både forskere og almindeligt kulturinteresseredeborgere.Ca. 355.000 timer lydoptagelser fra arkiv (DR). Materialet ligger på spolebånd og DAT-båndog indeholder samtlige radioprogrammer fra 1989 og frem til i dag. Der er således tale om etmateriale med meget stor samtidshistorisk interesse for både specialister og almentinteresserede.
20
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Levende billeder500 stumfilm fra 1896-1930 (DFI), størstedelen dokumentariske. Der er tale omdokumentariske optagelser fra starten af 1900-tallet samt især kortere fiktionsfilm, somtilsammen tilbyder et vindue til Danmark for 100 år siden. Mange af filmene er ikke længereomfattet af ophavsret og kan dermed stilles frit til rådighed på internettet. Flere filmportrætterer kendte danskere fra datidens kulturliv, politik, samfund og kongehus. Der ereksempelvis optagelser med Konseilspræsident C. Th. Zahle (1912), Maleren KristianZahrtmann (1913), samt Zar Nikolai den 2. (1901). Filmene vil indgå i projektet EuropeanFilm Gateway.Skønsmæssigt 28.000 pligtafleverede VHS/dvd’er (SB). Der er tale om både løbendeafleveringer og om indhentning af efterslæb i digitaliseringen. Der er tale om digitaliseringmed henblik på at bevare den komplette samling. Bevaring af billedmedierne i deresnuværende form er en stor udfordring, både fysisk og formatmæssigt, ogbevaringsdigitalisering har derfor meget høj prioritet.Tv-udsendelseron demand(SB). Der er ikke inden for rammerne af forslag 1 ressourcer til enfuld digitalisering af Statsbibliotekets store samling af komplette danske sendeflader fra DR,TV 2 og regionalstationerne, men der vil kunne ske digitalisering af i alt ca. 10.000 enheder, itakt med at de efterspørges.Ca. 52.000 timer timers videooptagelser fra arkiv (DR). Materialet findes på en rækkeforskellige videoformater og udgør en stor del af DR’s sendeflade fra slutningen af firserne ogfrem, plus en del ældre udsendelser digitalisereton demand.
3.2 Udvalgets bemærkningerDigitaliseringen inden for rammerne af forslag 1 tager udgangspunkt i en udvælgelse af særligematerialer, og der vil kun i begrænset omfang være tale om digitalisering af komplette samlinger. I endel tilfælde må bevaringshensynet overskygge formidlingshensynet, fordi kulturarvsinstitutionernesførste prioritet er at bevare samlingerne, så de efterfølgende kan tilgængeliggøres og formidles.Fordelen ved forslag 1, når man taler om forholdet mellem indsats og udbytte, er, at man fokuserer pådet mest efterspurgte og efter en forhåndsvurdering mest interessante.Ulempen ligger omvendt i en manglende skala. Der udnyttes således ikke den fulde effektivitet i selvedigitaliseringen og den tekniske bevaring og tilgængeliggørelse, men især har det betydning for denkritiske masse på selve indholdssiden.Som det fremgår af det tekniske bilag, kan man, også inden for forslag 1, gøre rigtig meget for enforbedret tværgående søgbarhed og brugbarhed, blot ved den rette anvendelse af standarder ogmetadata. Men den begrænsede volumen i digitaliseringen betyder, at der kan mangle kritisk masse iforhold til at give brugeren mulighed for at bevæge sig frit i materialet. Man kan komme til at gåforgæves, og det er vanskeligt for materialet at give fuld belysning af samlede temaer – uanset
21
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
tværgående søgemuligheder vil materialet set fra brugerens synspunkt i nogen grad fortsat fremståsom enkeltsamlinger.For forskere kan dette nedsætte brugbarheden – hvilket kan have betydning i forhold til at brugedigitaliseringen til at styrke den danske position i den internationale forskning inden for kulturelle ogæstetiske fag.Men også i en undervisningssituation kan det have betydning, at volumen mangler. Muligheden for atbevæge sig frit rundt i dansk kulturarv vil være indskrænket til udvalgt materiale.Sammenfattende er der tale om et forslag, der giver et spændende og værdifuldt indblik i kulturarvenog sikrer enkelte værdifulde samlinger for eftertiden, idet forslag 1 dog samtidig indebærer betydeligefravalg samt begrænset mulighed for fuldt ud at realisere de stordriftsfordele, der er ved model 2 og 3.Faktaboks:Indhøstede erfaringer – DR’s KulturarvsprojektDR modtog 75 mio. kr. i forbindelse med den seneste mediepolitiske aftale. Disse midler anvendes tilat påbegynde sikringen og digitaliseringen af dele af DR’s audiovisuelle arkiver. Samtidig indgår DR ien række afklarende projekter for at undersøge perspektiverne i den fælles danske digitale kulturarv.DR’s kulturarvsprojekt har således ageret pilotprojekt i samarbejde med RUNAS institutionerne ogDFI i forbindelse med både undersøgelser og test af formidlingsløsninger, metadata og filformater. Semere herom i faktaboks side 14 eller på www.danskkulturarv.dk.Overordnet kan aktiviteterne i DR’s Kulturarvsprojekt inddeles i to kategorier:Massedigitalisering og sikringDR’s arkiv består af mange forskellige samlinger og formater og har en volumen og beskaffenhed, der inogle tilfælde muliggør, at eksterne leverandører kan byde på selve digitaliseringsopgaven påkonkurrencedygtige vilkår. DR er i gang med to sådanne eksterne samarbejder, der begge vurderes atmedføre økonomiske besparelser.Samtidig oplever DR, at den teknologi, der er brug for, bliver billigere over tid, og omkostningernereduceres derfor løbende.Formidling og samarbejdeI forbindelse med projektet har DR samarbejdet med en hel række andre kulturarvsinstitutioner omwww.danskkulturarv.dk(se faktaboks side 14 ovenfor).Et andet og meget succesfuldt tiltag har væretBonanza– det bedste og det værstefra DR’s arkiversom blev lanceret med udgangspunkt i rettighedsaftalen mellem DR og Copydan. Ideen var at inddragebrugerne i en kæmpe afstemning om, hvor digitaliseringen og tilgængeliggørelsen skulle starte.Alle danskerne blev inviteret med, og brugerne fik mulighed for at vælge deres favoritter inden for 10kategorier, hvor der samlet blev vist smagsprøver fra 1.000 forskellige programrækker, shows,nyheder, dramaserier og meget mere. Over 100.000 mennesker deltog i afstemningen, og hjemmesidenhar nu haft mere end 12 mio. visninger på under et år. Interessen har været enorm, og hjemmesiden eren kulturperle, der med al tydelighed viser potentialer ved at flytte materialerne op fra kælderen og udtil brugerne gennem en digitaliserings- og sikringsproces.
22
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Resultaterne af DR’s undersøgelser og analyser, og erfaringerne fra alle formidlings- ogsamarbejdsprojekterne, viser, at brugerne meget gerne vil have adgang til materialerne. De ønsker atgense eller opleve dem og gerne på tværs af samlinger. Materialerne beriger hinanden, og samlingernerummer et nærmest uendeligt socioøkonomisk potentiale, hvis synergieffekterne udnyttes.Materialerne og brugerne kan skabe relationer på tværs af samlingerne, hvilket udvider oplevelsernefor brugerne. Brugerne er aktive og vil gerne bidrage gennem forskellige former for deltagelse. Hvisden moderne teknologi indarbejdes rigtigt, kan denne deltagelse fremadrettet både give brugerneadgang og oplevelser i en positiv spiral.
23
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
4 Forslag 2
4.1 Udvalgets forslagInden for de økonomiske rammer af en øremærket bevilling på i alt 250 mio. kr. i 2010-2019 foreslårudvalget digitalisering af nedenstående materialer i perioden 2010-19.Hertil kommer udgifter til tilgængeliggørelse, der løbende vil stige op til ca. 10 mio. kr. årligt vedudløbet af perioden, jf. afsnit 2.2.Samlet indebærer forslag 2 således merudgifter på i alt 300 mio. kr. i perioden 2010-197.Der er tale om følgende materiale ud over det, der er nævnt i forslag 1:Trykte tekster, arkivalier, håndskrifter mv.30.000 tekstsider fra særsamlinger om markante danske filmpersonligheder (DFI). Der er taleom samlinger vedr. Carl Th. Dreyer, Asta Nielsen og Theodor Christensen, nogle af de, ikkemindst i international sammenhæng, mest interessante danske filmpersonligheder, ogdigitaliseringen vil dermed være forskningsmæssig væsentlig. Der er også tale omfilmpersonligheder, som er oplagte at beskæftige sig med i undervisningssammenhæng.Arkivalier vedr. skiftevæsen (ca. 7,5 mio. sider). Skiftearkivalierne knytter sig til dekirkebøger og folketællinger, som i dag er tilgængelige via nettet. Skiftearkivalier indeholderisær for 1900-tallets vedkommende oplysninger, som stadig kan have betydning i forbindelsemed dokumentation af arveretlige forhold. Desuden spiller skiftearkivalier en rolle forslægtsforskere, idet skifterne indeholder oplysninger om afdøde personers familiemæssige ogøkonomiske forhold. Skiftearkivalier findes flere forskellige steder i arkiverne, hvor de erarkiveret efter arkivskaber, først og fremmestoooooo(Kriminal)retterBy-, herreds- og birkefogederAmtmændGodsejereProvsterSærlige skifteretter
Der er tale om et meget omfattende materiale, i alt ca. 7,5 mio. optagelser. Heraf påregnes ca.5 mio. at kunne skannes på grundlag af eksisterende mikrofilm.Udvalgte myndighedsskabte søgemidler fra centraladministration om amter. (ca. 2,5 mio.sider) Under betegnelsen ”myndighedsskabte søgemidler” gemmer sig myndighedernesDette er baseret på den forudsætning, at omkostningerne til digital bevaring og tilgængeliggørelse – der afhænger af det digitalemateriales omfang – er jævnt stigende over perioden, i takt med at materiale digitaliseres; dvs. i gennemsnit er 5 mio. kr. pr. år. Detbemærkes, at omkostninger til bevaring og tilgængeliggørelse er vanskelige at skønne på længere sigt, da den teknologiskeudvikling løbende reducerer omkostningerne pr. lagerenhed. Hvilken tilgængelighedskvalitet man vil kunne få for de i forslagetafsatte midler, er derfor ikke muligt at sige præcist på nuværende tidspunkt.7
24
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
fortegnelser og registre over deres sager og dokumenter. Søgemidlerne er indgangen tilarkivernes indhold, fremstillet af de offentlige myndigheder til eget brug. Søgemidlerne bestårbl.a. af journaler, navneregistre, postlister og brevregistre. Udtrykt på anden vis omfatter”søgemidler ” de myndighedsskabte metadata til de dokumenter, der indgår i den offentligeforvaltnings arkivalier i Statens Arkiver. I dag kan de myndighedsskabte søgemidler kunbenyttes på læsesalen ved den arkivinstitution, hvortil de er afleveret. Søgemidler gøres af enrække bevaringsmæssige og praktiske hensyn ikke til genstand for fjernlån. Ved at læggeudvalgte myndighedsskabte søgemidler på nettet kan det opnås, at en langt større del afpublikum får mulighed for at gennemføre den søgeproces, der er nødvendig for at identificerenetop de oplysninger, der efterspørges. Gøres journaler, journalregistre, brevregistre mv.tilgængelige digitalt, får brugerne mulighed for hjemmefra at fremfinde konkrete sager, somderefter via Statens Arkivers elektroniske søgedatabase Daisy vil kunne forudbestilles. Kunsøgemidler, der er umiddelbart tilgængelige, dvs. over 75 år gamle, skannes.11 mio. avissider; 11 landsdækkende og 10 regionale aviser fra perioden 1749-1990 (SB).Projektet planlægges af Statsbiblioteket og ønskes gennemført i samarbejde med en privatudbyder.Faktaboks:Avisdigitaliseringsprojektet11 millioner avissider fra de sidste 250 år ligger i dag omhyggeligt bevaret men vanskeligttilgængelige i Statsbibliotekets magasin i Århus. Aviserne afspejler dag for dag – helt tilbage fra 1749– tidens internationale, nationale og lokale begivenheder og fortæller samtidig detaljeret om detdanske demokratis udvikling og om dagliglivet på landet og i byerne gennem tiderne.Disse 11 millioner avissider indgår i projektetAvisbibliotek Danmark,som Statsbiblioteket ifællesskab med en privat udbyder ønsker at gennemføre. Det drejer sig om 11 landsdækkende og 10regionale dagblade fra deres respektive start. Aviserne skal digitaliseres og tilgængeliggøres på nettettil glæde for forskning, undervisning, erhvervsliv, herunder medierne selv, samt for alle danskeborgere. Anslåede projektudgifter er 58 mio. kr.ForretningsmodellenProjektet rummer store værdier, der kan realiseres både ud fra en samfundsmæssig og en kommercielsynsvinkel. Statsbiblioteket ønsker at digitalisere det historiske materiale med henblik på at kunnestille det til rådighed for den danske befolkning som ’public service’, mens den private udbyder skalkunne kapitalisere på indhold, dvs. en kommerciel model, hvor indholdet kan sælges til både private,erhvervslivet, biblioteker og undervisningsinstitutioner. Markedet skal kunne udnytte den del afmaterialet, som har kommercielt potentiale, mens materiale med lidt eller intet kommercieltpotentiale skal stilles gratis til rådighed for alle.Det kan ske ved at den kommercielle partner efter aftale med rettighedshaverne får kommercielråderet over aviser fra nyere tid, mens Statsbiblioteket får råderet over det ældre historiske materiale,som stilles gratis til rådighed for hele den danske befolkning.Med en statslig finansiering, kombineret med det kommercielle potentiale og bidrag fra fonde,vurderes det, at projektet vil kunne realiseres inden for rammerne af udvalgets forslag 2.
25
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
40.000 sider dansk fotografisk litteratur (KB). Der er tale om litteratur, som kan supplere ogperspektivere det store billedmateriale, som Det Kongelige Bibliotek vil kunne digitalisereinden for rammerne af forslag 2.
1,4 mio. sider dansk topografisk litteratur (KB). Materialet vil kunne perspektivere det storetopografiske billedmateriale, som kan digitaliseres inden for rammerne af forslag 2.
650.000 sider tekst, mindst 325.000 tegninger og mere end 300.000 fotografier, som tilsammenudgør Antikvarisk-Topografisk Arkivs hovedarkiv (NATMUS). Det er et af museets størstearkiver, hvad angår oplysninger om og billeder af landets middelalderlige og nyerefortidsminder såsom kirker, borge og voldstæder, herregårde og købstæder. Alt materialet erplaceret topografisk i sogne (2.130), herreder og amter efter inddelingen i Trap Danmarks 4.udg. Arkivet rummer beretningsmateriale, tegninger, akvareller, stik og fotografier. Arkivetomfatter ikke alene det nuværende Danmark, men har også materiale fra Færøerne,Grønland, Island, Skåne og Slesvig-Holsten. Til de ældre beretninger om f.eks. kalkmalerierhører akvareller udført af anerkendte konservatorer og kunstnere som J. Magnus Petersen ogJ. Kornerup. I enkelte tilfælde er disse akvareller eneste vidnesbyrd om kalkmalerier, som idag ikke længere eksisterer. Arkivet er meget benyttet både af interne og eksterne brugere.
410.000 sider erindringer nedskrevet af ca. 41.000 almindelige mennesker indsamlet siden1939 (NATMUS). Erindringerne findes i beretningsarkivetNationalmuseets EtnologiskeUndersøgelser.Erindringerne kan dels være komplette levnedsbeskrivelser, dels besvarelser afspørgelister om specielle emner. Materialet er et enestående fond af både sproglig, kulturel oghistorisk interesse.
Billeder44.000 stillbilleder fra kort- og dokumentarfilm (DFI). Jf. forslag 1 betyder dette, at helefilminstituttets samling af stills fra kort- og dokumentarfilm digitaliseres. Den fuldedigitalisering betyder en væsentlig forøgelse af værdien for forskere, og også en betydeligforøgelse af mulighederne for brug i undervisningssammenhæng.Dele af Bygningsfredningsarkivet og Arkivet over Fredede Fortidsminder (KUAS), jf. forslag 1.Inden for rammerne af forslag 2 vil det være muligt at digitalisere væsentlige dele afmaterialet (om end materialets ukurante karakter af arbejdsarkiv gør det vanskeligt atvurdere præcist hvor meget). En større volumen i det digitaliserede materiale vil gøre, at detbedre kan spille sammen med samlinger fra f.eks. Nationalmuseet og Det Kongelige Bibliotek.70.000 værker fra Den Kongelige Kobberstikssamling (SMK). Inklusive forslag 1 og alleredeforetagne digitaliseringer vil i alt ca. 110.000 af samlingens 245.000 værker dermed væredigitaliseret, og den digitale samling vil for alvor få værdi som brugbar samling iforskningsøjemed.
26
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Faktaboks:Den Kongelige KobberstiksamlingKobberstiksamlingen er en af de ældste grafiksamlinger i verden. Den kan formentlig føres tilbage til1500-tallet, hvor de danske konger lagde grunden til den store samling, der i dag omfatter ca. 245.000værker. Allerede i 1843 blev den tilgængelig for offentligheden, og i 1896 flyttede den ind på StatensMuseum for Kunst, da museet stod færdigt.Kobberstiksamlingen rummer dansk og international tegnekunst og grafik, der spænder fra 1400-tallet over det moderne til samtidskunsten. En betragtelig del af samlingen udgøres af den ældre,europæiske grafik med eksempler på meget sjældne tryk, som kun findes på få museer i verden. Udover repræsentative samlinger af især danske tegninger findes der en stor bestand af skitsebøger,kunstnerbøger og kunstnermapper samt en samling af fotografier, der er opbygget i de seneste årtier.Fra gammel tid er samlingen løbende blevet registreret i inventarprotokoller og i de såkaldtearkkataloger. Men sammenlignet med udenlandske grafiksamlinger, der systematisk registrerer deresværker elektronisk, er det endnu kun en lille del af Kobberstiksamlingen, der er blevet gjorttilgængelig for brugerne via museets kunstdatabase. Set i det store perspektiv er samlingen såledesrelativt ukendt for internationale forskere, der ikke har mulighed for gennem det digitale medie atskaffe sig kendskab til samlingens værker og derfor afskæres fra at udnytte det potentiale, somsamlingen rummer i forhold til forskningen og den udstillingsvirksomhed, museet meget gerne vilbidrage til. En digitalisering af samlingen vil omvendt give museet lejlighed til at indgå i et udvidet,internationalt samarbejde, der vil få betydning for Kobberstiksamlingens egen forskning ogudstillingsaktiviteter.
5.000 danske kort (KB). Denne værdifulde samling er i analog form besværligt tilgængelig,bl.a. fordi sådanne samlinger er blandt de mest udsatte for tyveri, men med lettere adgang vilkortsamlingen utvivlsomt være blandt de mest interessante for brugerne, ligesom den er etgodt udgangspunkt for brug af bibliotekets store samling af topografisk materiale i øvrigt.
Knap 700.000 luftfotos (KB). Sylvest Jensen-samlingen består af luftfotografier fra perioden1936 til 1990 Luftfotografierne er dels optagelser af fritliggende ejendomme, oftest optaget 2-4gange i perioden, optagelser af landsbyer samt en lang række optagelser fra større byer såveloversigtsbilleder som detailbilleder af områder. Materialet giver således en eneståendebeskrivelse af såvel bygningers som landskabers udvikling i perioden. KB har fuld ophavsrettil materialet. 700.000 fotos udgør ca. halvdelen af samlingen.
200.000 topografiske fotos (KB). Der er tale om et stort fotografisk materiale, som kansupplere kort og luftfotos. Materialet er generelt også meget efterspurgt i forlagsbranchen.Sammen med kort og luftfotos vil materialet også betyde, at man som turist på forhånd vilkunne gå på opdagelse i det danske landskab.
300.000 danske postkort (KB). Samlingen af danske postkort rummer en stor mængdeinformation om dansk geografi og kulturhistorie og har stor anvendelighed i forskningsøjemed,som et spændende redskab i undervisningssituationer eller simpelthen som et materiale, hvorborgeren kan gå på opdagelse i sit lokalområde fra en ny vinkel.
27
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
600.000 portrætfotos (KB). Der er tale om broderparten af bibliotekets portrætsamling på i alt900.000 fotos. Fotografierne er forsynet med basale metadata om navn mv. og kan oplagtindgå i forskellige sammenhænge, hvor der etableres brugerskabte metadata på tværs afforskellige materialer.
Faktaboks:Det Kongelige Biblioteks portrætsamlingSamlingen af portrætter findes primært i Hovedsamlingen, hvor alle personer er registreret på navn iportrætregistranten. Ud over navn findes korte oplysninger om fødselsår, evt. erhverv og giftermål.Samlingen omfatter omkring 100.000 personer.Ud over Hovedsamlingen findes en lang række mindre særsamlinger (Pressehusets samling, DagensNyheder, Aftenbladet, Tidens Kvinder). Herudover findes negativarkiver i Albumsamlingen samt i dehundreder af protokoller fra en lang række forskellige fotografer.Portrætterne kan f. eks. indgå i undervisningsforløb inden for historie, samfundsfag ellerkunsthistorie, hvor man kan vise billeder af centrale aktører. De kan indgå i samspil medlydoptagelser af den pågældende fra f.eks. Statsbiblioteket, kombineres med arkivdata fra StatensArkiver eller med fotografier fra Kulturarvsstyrelsen af bygninger, de måtte have tegnet eller ladeopføre, manuskripter fra Det Kongelige Biblioteks håndskriftsafdeling eller kunstværker, de måttehave fremstillet.Herudover kan portrætterne bruges til vise træk af fotografiets udvikling, fortælle noget om mode ogbeklædningsudvikling, hårmode og andre historisk oplysninger, der kan aflæses af personfotografier,fotograferingsmetoder og andre sociale fænomener.
100.000 ENB-genstande, dvs. museumsgenstande af enestående national betydning(NATMUS). Billedmateriale af museets genstande er meget efterspurgt af både forskere,undervisningssektoren og den almindelige borger med interesse for kulturhistorien. I dagkender alle Solvognen og Gundestrupkedlen, men Nationalmuseet har mange genstande, sompå hver deres måde er lige så enestående, men i dag ganske ukendte uden for de snævrefaglige kredse. Digitaliseret som 3D-genstande, der kan drejes, så genstandene kan ses fra allesider, giver digitalisering mulighed for fordybelse og inspiration for både lægdpersoner,forskere og designinteresserede med mulighed for skabelse af ny kreativitet.
190.000 glasnegativer (NATMUS). Billederne er dels billeder af museets egne genstandeoptaget med henblik på udgivelse af museets statelige publikationer, dels egentligearkivbilleder, som stammer fra Nationalmuseets forskellige arbejdsområder: arkæologiskeudgravningsbilleder, ekspeditionsbilleder og andre former for dokumentationsbilleder afkulturhistorisk interesse. Materialet supplerer indholdet i Nationalmuseetsberetningsarkiver. Materialet er i sin analoge form stort set utilgængeligt.
28
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Faktaboks:Nationalmuseets BilledsamlingerI 1870’erne begyndte Nationalmuseets arkæologer at medbringe fotoudstyr, når de skulle påudgravning. Hidtil havde man haft tegnere til at dokumentere udgravningsarbejdet. Sådan foregik detf.eks. i Nydam Mose i Sønderjylland ved udgravningen af det berømte våbenmosefund.Mange af de senere så berømte udgravninger blev dokumenteret med den moderne fototeknik. F.eks.Ertebølle-stenalderens køkkenmøddinger og bronzealderens gravhøje. I 1891 udgravede Vilhelm Boyelokaliteten Guldhøj, og både fundet og fundomstændighederne af de berømte egekister blev nøjefotograferet. Senere i 1922 blev den enestående Hjortspringsbåd fra førromersk jernalder udgravet ogdokumenteret på glasplader. Dette enestående dokumentationsmateriale viser arkæologernes arbejde imarken, og det er vigtigt, at disse billeder bliver sikret for eftertiden og gjort tilgængelige, så de kanbidrage til vores forståelse af det særlige ved Danmarks Oldtid og formidlingen af den.
Kulturhistorikeren Hugo Matthiessen arbejdede i en længere årrække på Nationalmuseet. Med støttefra en række byråd fotograferede han gamle huse og gadebilleder fra danske købstæder. Købstædernevar på den tid under kraftig forandring. Disse fotos er i dag meget benyttede som dokumentation afkøbstædernes udvikling og ændrede vilkår og har stor lokalhistorisk interesse.Derudover har Nationalmuseet topografisk og emneordnede fotosamlinger, som dokumentereralmindelige danskeres dagligdag gennem tiden: arbejdet på land og i by, de forskellige håndværk,mænd og kvinder, unge og gamle. Nationalmuseet har desuden en stor samling billeder frabesættelsestiden (ca. 60.000).NM har også fotodokumentation fra mere fremmede himmelstrøg. I Etnografisk Samling findes såledesbilleder fra de store ekspeditioner: Thuleekspeditionerne 1912-33, Henning Haslund ChristensensCentralasiatiske Ekspeditioner 1936-39 og 1947; ekspeditioner hvor man ud over billedmaterialet ogsåtilvejebragte nogle af Nationalmuseets fineste genstandssamlinger.I Antiksamlingens billedsamling findes dokumentation fra museets deltagelse i CarlsbergfondetsRhodosekspedition 1902-14. Ud over at dokumentere kendte og ukendte danskeres tankevækkendetilstedeværelse overalt i Verden, inviterer disse billeder til formidling på mange niveauer, og desupplerer andre kulturinstitutioners kilder, så det samlede billede af tider, personer og begivenhederfår flere facetter, som giver mulighed for nye tolkninger for flere brugere af institutionerneskulturudbud.I Nationalmuseets fotosamlinger er der helt unikke billeder, som viser lokaliteter og forhold, som i dager helt forandrede eller forsvundet som f.eks. museets billeder fra den tsunamiramte atol Nias iIndonesiens Acehprovins. Billeder som i dag har stor betydning for den lokale befolknings identitet oghistorieopfattelse, idet øens eget arkivmateriale er gået tabt.
29
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Levende billeder3.000 timer (6.000 titler) kort- og dokumentarfilm på videomasters (DFI). Der er tale om ensamling af unik national værdi, som rummer både undervisningsfilm og vigtige kunstneriskeværker. Digitalisering i bevaringsformat er påkrævet, hvis ikke denne vigtige kulturarv skalgå tabt på sigt. Samtidig har Filminstituttet også i mange tilfælde de ikke-kommerciellerettigheder, hvorfor filmsamlingen, der er en unik kilde til nyere dansk historie, vil kunnegøres tilgængelig for forskere, uddannelsessøgende og via bibliotekerne. Der vil evt. ogsåkunne etableres tilgængelighed i fuld kvalitet for filmbranchen, hvilket kraftigt vil øgesamlingens værdi som råstof for nyproduktioner.Optagelser af sendefladen på dansk tv i perioden 1987-2005 (SB). I egenskab af StatensMediesamling har Statsbiblioteket indsamlet komplette danske sendeflader for hele periodenfra 1987, i alt svarende til 256.000 timer. Samlingen omfatter de landsdækkende og regionalekanaler under DR og TV 2, samt i udvalg kommercielle tv-stationer som TV3, TV-sport ogdiverse lokal-tv. I Statsbibliotekets nuværende aftale med Copydan indgår allerede enhensigtserklæring om indgåelse af en aftale om digital tilgængeliggørelse for målgrupper somvideregående uddannelser og journalister, for hvem den potentielle værdi af samlingen ermeget betydelig. Det skal tilføjes, at digitaliseringen også er bevaringsmæssigt påtrængende,da samlingen ligger på VHS-bånd.
4.2 Udvalgets bemærkningerInden for rammerne af forslag 2 kan man opnå en mere omfattende digitalisering end i forslag 1.Forslag 2 indebærer samtidig merudgifter på i alt 300 mio. kr. i forhold til forslag 1 i periode 2010-2019.Det kvalitative spring ligger i, at man inden for rammerne af forslag 2 i højere grad digitaliserer helesamlinger eller væsentlige dele af dem. Hermed forøges materialets potentiale til tværgående brug,eftersom der bliver flere og flere emner og problemstillinger, som man kan belyse med materiale fraflere samlinger, samtidig med at muligheden for at grave sig dybt ned i helt specifikkeproblemstillinger inden for enkelte samlinger også bliver større.Herved opnår de allerede i sig selv værdifulde samlinger forøget værdi for alle grupper af brugere,måske mest for to kategorier – nemlig demegetinteresserede (professionelle) brugere, og de iudgangspunktet måske lidt mindre interesserede.For de professionelle brugere, ofte forskere af forskellig art, betyder kompletheden af samlingerne enstor lettelse i materialesøgningen, fordi de i større omfang undgår at skulle finde analogt materiale.Det er dog først med et digitaliseringsomfang som i forslag 3, at fordelene for forskergruppen høstesfuldt.For de i udgangspunktet lidt mindre interesserede – det kan være skoleelever i enundervisningssituation eller blot den lidt løst søgende almene bruger uden nogen specifik interesse –betyder den store bredde sandsynligvis også meget. Den giver en øget frihedsgrad og betyder, at mansjældnere søger forgæves i materialet: giver forøgede muligheder for spontant at søge på tværs.
30
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Det indfanger den tilfældige forbipasserende på nettet og fanger interessen for kulturarven, ligesomden gør brugen af materialet til en mere engagerende oplevelse for eleven i en undervisningssituation.Ikke mindst i undervisningssituationen tillader den større volumen også en mere selvstændig ogkreativ brug af materialet, som kan øge indlæringspotentialet.Også for elever i de yngre klasser, for hvem det brede søgeudvalg måske er svært at forholde sig til,kan det have betydning, at man med den bredere digitalisering får adgang til materiale fra stort setethvert sted i landet, således at man præsenterer denne aldersgruppe for kilder, som direkte relaterersig til deres hverdag og lokalområde.Formidlingseksempel:Tre tværgående temaerMed udgangspunkt i det digitaliserede materiale i forslag 2 kunne man skabe en formidlingsportalrettet mod folkeskoler og ungdomsuddannelser, der kan fungere som indgang til materialet iperspektiv af tre temaer:Fra Landbrugssamfund til Vidensamfund, Historie og ErindringsamtDet 20.Århundrede Kultur.Under temaetFra Landbrugssamfund til Vidensamfundkan samles kort, luftfotos, andre topografiskefotos og til dels postkort fra KB og tinglysningsdokumenter mv. fra Statens Arkiver til belysning afkulturlandskabets udvikling gennem de sidste 150 år, sammen med avissamlingen fraStatsbiblioteket, som belyser den sideløbende samfundsudvikling. Man vil kunne fremsøge oplysningerom stort set et hvilket som helst sted og en hvilken som helst begivenhed i den historiske overgang tildet moderne samfund, således at brugeren oplever virkelig frihed i materialet og ikke bare oplever atarbejde med en lærebog på internettet.Under temaetHistorie og Erindringkan sammenkobles en mængde materiale om samfundsmæssig ogpersonlig erindring: arkiver om fortidsminder og arkæologi, erindringer, portrætfoto, tv-udsendelsermv. Materialet vil være en uudtømmelig kilde til belysning af spørgsmål om historie og identitet:uhyre relevante spørgsmål i undervisning på alle niveauer.Under temaetDet 20. Århundredes Kulturkan samles et unikt dokumentationsmateriale om kultureni de sidste 100 år, i form af film, tv-sendeflader, musik, aviser, og samlinger af postkort og småtryk –et materiale som vil kunne bruges i forbindelse med stort set ethvert emne i nyere danskkulturhistorie.En fordel ved forslag 2 er, at rigdommen og frihedsgraden i materialet kan trække nye brugergruppertil på en måde, som det nøje udvalgte materialeudvalg under forslag 1 ikke kan – fordi man herrisikerer at blive skuffet eller frustreret, når det, man spontant søger, ikke er der, og den iudgangspunktet mindre motiverede bruger kan dermed hurtigt give op.På den måde kan forslag 2 i højere grad bidrage til at gøre kulturarven til alle mands eje.Ulempen ved forslag 2 i forhold til forslag 1 er derimod, at man med den større volumen og merekonsekvente samlingsdigitalisering i højere grad vil digitalisere materiale, der kun vil blive meget lidtbrugt. Til gengæld falder marginalomkostningerne pr. inkluderet enhed formodentlig relativt meget.
31
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
5 Forslag 35.1 Udvalgets forslagInden for de økonomiske rammer af en øremærket bevilling på i alt 500 mio. kr. i 2010-2019 foreslårudvalget digitalisering af nedenstående materialer i perioden 2010-19.Hertil kommer udgifter til tilgængeliggørelse, der løbende vil stige op til 10-15 mio. kr. årligt vedudløbet af perioden, jf. afsnit 2.2.Samlet indebærer forslag 3 således merudgifter på op til i alt 570 mio. kr. i perioden 2010-198.Der er tale om følgende materiale ud over det, der er nævnt i forslag 1 og 2:Trykte tekster, arkivalier, håndskrifter mv.100.000 sider danske atlas (KB). Der er tale om en mindre del af bibliotekets samling afdanske atlas, som vil tjene til at supplere den kortsamling, som digitaliseres under forslag 2.Hermed vil kortsamlingen blive nærmere komplet, hvilket vil have stor værdi for forskere mv.,da det vil reducere behovet for at benytte de analoge faciliteter.250.000 sider småtryk af særlig topografisk interesse (KB). Der er tale om samlinger af lokalepolitiske blade, lokale idrætsblade, kirkeblade, skoleberetninger mv., som har stor interesse isamspil med de øvrige topografiske samlinger og kan levere interessant lokal- ogpersonalhistorisk materiale både til professionelle historikere, slægtshistorikere ogalmindeligt interesserede borgere.1,4 mio. sider topografisk litteratur (KB). Hermed vil en meget omfattende samlingtopografisk litteratur (2,8 mio. sider i alt) være digitaliseret, og et meget dybdegåendemateriale vil være tilgængeligt til at levere kontekst og perspektiv til det topografiskebilledmateriale.1 mio. sider dansk-norsk personalhistorie (KB). Der er tale om en samling, der har oplagtinteresse også for ikke-professionelle, og som er skræddersyet til at spille sammen medsamlingen af portrætfoto.Arkivalier af særlig slægtshistorisk interesse, ca. 1 mio. optagelser (SA):ooooLægdsruller og sørullerTestamentprotokollerFæsteprotokollerBorgerskabsprotokoller
Disse arkivalier hører til blandt dem, der efterspørges af slægtsforskere, og knytter sig såledestil kirkebøger, folketællinger og skiftearkivalier.
8
Jf. note 7, side 22, regnes der med 7 mio. kr. pr. år i gennemsnit.
32
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Udvalgte søgemidler (SA). Som 2: yderligere 2 mio sider.Forsikrings- og taksationsprotokoller vedr. brandforsikring (SA) (3,5 mio sider). Materialetindeholder oplysninger om forsikrede bygninger helt tilbage fra 1700-tallet, med oplysningersom ejernavne, vurderinger og forsikringsmæssige beskrivelser af ejendommes bygninger.Materialet har således stor interesse i bygningshistorisk, slægtshistorisk og lokalhistoriskperspektiv, men er i analog form ret vanskeligt anvendeligt.
100.000 sider fra Nordisk Films kontorarkiv fra 1906-70 (DFI). Der er tale om et materiale,der vil have stor værdi for forskere og andre med interesse for at studere dansk films historie,og som vil supplere øvrigt digitaliseret materiale på filmområdet.
500.000 sider tekst fra Antikvarisk-Topografisk Arkivs korrespondancearkiv, samt ca. 325.000sider fra arkivets øvrige sidearkiver (NATMUS). Dette materiale fortsætter tidsmæssigtBygningsfredningsarkivet og Arkivet over Fredede Fortidsminder i KUAS.
200.000 sider tekst fra mere end 50.000 almindelige danskere, som skrev dagbog den 2.september 1992 efter opfordring fra Nationalmuseet og DR (NATMUS). Dagbøgerne er etenestående øjebliksbillede med fortællinger fra barndom og voksenliv, som det blev erindret enbestemt dag i 1992. Denne enestående dokumentation af danskeres holdninger til tilværelsenvil set i sammenhæng med avisartikler, tv-produktion mv. fra samme dag give mulighed for etaldrig tidligere set punktnedslag i Danmarks historie. Materialet er en del af NationalmuseetsEtnologiske Undersøgelser.
125.000 sider tekst fra to af Nationalmuseets store bogværker: Værket Danmarks Kirkersupplerer Antikvarisk-topografisk Arkiv med den nyeste forskning, og NationalmuseetsArbejdsmark er trods sin karakter af årbog stedet, hvor mange af museets genstande erpubliceret. Digitale udgaver med de moderne søgefunktioner vil øge tilgængeligheden afindholdet betragteligt
Billeder700.000 luftfotos (KB). Jf. forslag 2 vil den fulde Sylvestsamling så være digitaliseret, og denprofessionelle anvendelse af samlingen for forskere og erhvervsliv vil hermed blivebetragteligt lettet, ligesom det vil have stor betydning for borgeres og uddannelsessøgendesoplevelse af materialet, at man meget sjældent vil komme til at gå forgæves i den digitalesamling.100.000 øvrige topografiske fotografier (KB). Hermed vil i alt 300.000 øvrige topografiske fotosvære digitaliseret, og en meget omfattende samling vil hermed være tilgængelig digitalt.300.000 portrætfotografier (KB). Hermed vil hele bibliotekets samling på 900.000portrætfotografier være digitaliseret. Den komplette digitale adgang til samlingen vil selvsagtbetyde en lettelse for professionelle brugere, men vil også forbedre oplevelsen for almindeligeinteresserede borgere.
33
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
De formidlingsegnede dele af Bygningsfredningsarkivet og Arkivet over FrededeFortidsminder (KUAS), jf. forslag 1 og 2. Inden for rammerne af forslag 3 vil det være muligtat digitalisere alle væsentlige dele af materialet, ligesom der evt. også vil kunne inddragesrelevant materiale fra statsanerkendte museer. Herved vil et komplet billede af Danmarksfredede bygninger og fortidsminder være digitalt tilgængeligt.
95.000 værker fra Den Kongelige Kobberstikssamling (SMK). Inklusive forslag 1 og 2, samtallerede foretagne digitaliseringer vil i alt ca. 205.000 af samlingens 245.000 værker dermedvære digitaliseret. En så nær komplet digitalisering vil betyde, at samlingen vil være næstenfuldt tilgængelig online, hvilket kraftigt vil øge samlingens værdi for udenlandske forskere ogdermed forstærke museets placering i internationale forsknings- og museumsnetværk.
40.000 portrætter (DFI). Der er tale om fotografiske portrætter af primært danskeinstruktører og skuespillere, der kan komplementere det øvrige digitaliserede materiale frainstituttets samlinger.
60.000 stillbilleder fra danske tonefilm (DFI). Der er tale om en særsamling med stor interessefor forskere og andre filminteresserede, men også i forhold til medier og forlag.
150.000 billeder af genstande fra Danmarks Nyere Tid, som vil komplettere og suppleremuseets database over museumsgenstande (NATMUS).
100.000 nyoptagelser af formidlingsegnede museumsgenstande (NATMUS).60.000 billeder fra besættelsestiden (NATMUS).500.000 billeder fra museets mange billedsamlinger (NATMUS).
Musik og lydMusik indspillet i Danmark 1903-1960 (SB). Statsbiblioteket har så godt som alle danskemusikudgivelser fra de sidste 100 år, og 78’-pladesamlingen, som dækker perioden 1903-1960,udgør derfor en komplet indgang til den danske musikskat i perioden. Adgangen til dennemusik er i dag stærkt begrænset, da de gamle plader ikke kan udlånes af hensyn tilsamlingens bevaring, og fordi brugerne ikke har afspilningsudstyret. Størstedelen af denmusik, der indgår i samlingen, er i dag kun tilgængeligt ved personligt fremmøde påStatsbiblioteket i Århus, men vil i digital form kunne give et vigtigt og spændende indblik idansk kulturhistorie.Levende billederDanske reklamefilm 1900-1955 (SB). Der er tale om en samling på skønsmæssigt 10.000reklamefilm, der giver et unikt indblik i dansk historie i perioden, men som i analog form erstort set fuldstændig utilgængelig, og som samtidig har et stærkt behov for enbevaringsindsats. Samlingen vil kunne have stor værdi for forskere og iundervisningssituationer, stor interesse for borgerne generelt og vil også kunne væreværdifuld som inspirationsværktøj for reklamefilmbranchen i dag. Samlingen vil supplere de
34
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
nyere danske reklamefilm, som Statsbiblioteket i dag stiller online til rådighed for forskere ogstuderende ved de videregående uddannelser i hele landet i henhold til en aftale medCopydan.2.000 kort- og dokumentarfilm på filmbase fra 1939 til i dag (DFI). Jf. forslag 2 vil helesamlingen på ca. 8.000 kort- og dokumentarfilm (i alt ca. 4.000 timer film) hermed væredigitaliseret, og en unik kilde til dansk samfunds- og kulturhistorie vil hermed være fuldtdigitalt tilgængelig. Samlingen i sin helhed vil formodentlig kunne formidles til videregåendeuddannelser og folkeskoler.Faktaboks:Kort- og dokumentarfilmsamlingenDet Danske Filminstituts kort- og dokumentarfilmsamling består primært af film produceret for ellergennem støtte fra statslige filminstitutioner som Ministeriernes Filmudvalg, Dansk Kulturfilm ogStatens Filmcentral. Samlingen indeholder oplysende, opdragende, og i nogle tilfældeeksperimenterende film, der beskriver alt fra hjemlig hygiejne til verdensrummets sammensætning.Det vil være svært at finde emner, der ikke er beskrevet i disse over 5.000 film, der er produceret fra1930’erne til i dag. Det er en ressource, der ikke alene indeholder information om utallige emner, menogså er en historisk kilde til, hvordan staten og samfundet historisk har belyst disse emner. Der er taleom film produceret til den danske befolknings glæde og opdragelse, der i dag kan belyse ikke alene dehistoriske forhold, men også hvordan det offentlige Danmark har henvendt sig til befolkningen, frarene umedierede optagelser af kunstnerisk optræden som ”Mary Wigman danser (1929)” tiloplysningsfilm som ”Enlige mødre (1954)” eller portrætfilm om danske kunstnere som ”IngerChristensen – Cikaderne findes (1998)”.Ud over selve filmene besidder DFI supplerende samlinger i form af fotos og dokumentsamlinger, derkan berige samlingens forskningsmæssige og samfundshistoriske værdi ved sammenstilling i digitalform.
5.2 Udvalgets bemærkningerForslag 3 byder på en digitalisering, der giver meget stor bredde og dybde i det digitaliseredemateriale. Fokus er kort sagtkomplethedi de digitaliserede samlinger – selvom der naturligvis fortsatkun er tale om en delmængde af den samlede, digitaliseringsværdige kulturarv og i den forstandselvfølgelig ikke er tale om komplethed i total forstand, kun i forhold til de enkelte samlinger.Men også dette byder naturligvis på store, ekstra muligheder for alle brugere, men især giver det enekstra dimension for de brugere, der arbejder meget seriøst med det digitaliserede materiale.Dette har betydning for forskere inden for især de samfundsvidenskabelige, humanistiske og æstetiskefag. Den digitale tilgængelighed af så mange forskellige ressourcer betyder en stor lettelse i adgangentil kildematerialet, fordi man i meget vid udstrækning ikke længere behøver tilgå de besværligeanaloge materialer.
35
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
I forhold til den stigende internationalisering af forskningsverdenen er det også af stor betydning fordanske forskere, at internationale kolleger kan opnå fjernadgang til dansk materiale og således letterekan engageres i samarbejde med udgangspunkt i danske materialesamlinger af høj kvalitet. Sådantsamarbejde kan være afgørende for at kunne udnytte den eksplosive vækst i tværdisciplinærtsamarbejde, som man oplever i disse år, og som utvivlsomt vil blive styrket fremover.Man skal heller ikke være blind for, at muligheden for at deltage i internationale netværk er væsentligfor danskere forskeres muligheder for at få del i internationale finansieringskilder som f.eks. EU-midler. Her må man også have i baghovedet, at lande som eksempelvis Frankrig, Nederlandene ogNorge også satser kraftigt på digitalisering i disse år, og at det dermed vurderes at skulle sikres, atdanske forskere og forskningsinstitutioner har adgang til materiale svarende til deres udenlandskekollegaer.Det er imidlertid ikke kun i forskningssammenhænge, at der er en stor værdi ved at gøre megetkomplette samlinger tilgængelige digitalt. Der er også en værdi for uddannelsessektoren heri.Uddannelsessektoren står, på alle niveauer fra folkeskole til universitet, over for store udfordringer idisse år. Fremtidens samfund og arbejdsmarked kræver, at uddannelsessystemet ikke blot bibringerde uddannelsessøgende viden, men også kyndighed i at erhverve og udnytte viden.Den hidtidige erfaring viser imidlertid, hvor let arbejdet med disse færdigheder i realiteten bliver enuseriøs substitut for reel læring, hvis man ikke arbejder med et ordentligt kildemateriale og fyldigtkildemateriale, med dybde og kvalitet, og hvor bredden er så stor, at man har reel frihed til at defineresit emne.Her tilbyder den mest ambitiøse plan for digitalisering af kulturarven et kildemateriale, der kanbruges til behandling af stort set ethvert historisk, kulturhistorisk og geografisk emne i danskkontekst, og som kan engagere elever og studerende gennem muligheden for konstant at finde nyematerialer og vinkler.Endelig skal man også erindre den store værdi, som et komplet kildemateriale har forkulturerhvervene, f.eks. medievirksomheder som tv-produktionsselskaber og forlag. Det størsteerhvervsmæssige potentiale ligger dog utvivlsomt i virksomheder, der udvikler helt nye netbaseredeforretningskoncepter, byggende på digitaliseret kulturarvsmateriale.Ulempen ved forslag 3 i forhold til forslag 1 er, at man med den større volumen og mere konsekventesamlingsdigitalisering i endnu højere grad end forslag 2 vil digitalisere materiale, der kun vil blivemeget lidt brugt.Samlet må udvalget således bemærke om forslag 3, at det sikrer digitalisering af en meget storvolumen materiale, som vil skabe kritisk masse i forhold til alle brugergrupper. Til gengæld vil dernaturligvis være tale om en meget vidt favnende digitalisering, hvor man ikke kun fokuserer på detudsøgte, men inden for nogle kategorier (ikke mindst fotos) i høj grad får digitaliseret meget bredt.
36
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Bilag 1: Skematisk oversigt over forslagForslag 1Materiale0,6 mio. sidertekst mv.0,2 mio. stk.fotos mv.6 mio. arkiv-optagelser31.300 timerlyd96.200 timerlevendebillederTilgængeliggørelseObligatoriskfællesstandard formetadataObligatoriskfælles standardfor metadataMulighed forfælles be-varingsinfra-strukturMulighed forfælles stream-ingserverFormidlingObligatoriskfælles standardfor metadataMulighed forfælles be-varingsinfra-strukturMulighed forfælles stream-ingserverFælleseksponering tilsøgemaskinerØkonomiskekonsekvenserEngelsksprogetindholdsoversigtMerudgifter på ialt 570 mio. kr. iperioden 2010-19.Forslag 214,1 mio. sidertekst mv.3,0 mio. stk.fotos mv.16 mio.arkivoptagelser31.300 timer lyd355.000 timerlevende billederForslag 317,8 mio. sidertekst mv.5,1 mio. stk.fotos mv.22,5 mio. arkiv-optagelser32.500 timer lyd357.000 timerlevende billeder
Fælleseksponering tilsøge-maskiner
Fælleseksponering tilsøgemaskiner
afholdes indenfor institution-ernes ordinæreøkonomiskerammer
Merudgifter på ialt 300 mio. kr. iperioden 2010-19.
Materialeopgørelsen omfatter de finanslovsfinansierede kulturarvsinstitutioner. For hver model er dertale om en samlet opgørelse, dvs. ikke om, hvad der digitaliseres ekstra i forhold til den foregåendemodel.
37
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Bilag 2: Teknisk redegørelse vedr. digitalisering afkulturarven
38
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Indhold12Indledning ...........................................................................................................................................40Digitaliseringsprocessen ................................................................................................................422.12.22.3Indledning ...................................................................................................................................................................... 42Kompetencecentres rolle og opgaver.............................................................................................................................. 42Digitalisering af lyd........................................................................................................................................................ 44Indledning............................................................................................................................................................. 44Digitaliseringsprocessen ..................................................................................................................................... 44
2.3.12.3.22.4
Tekst- og billeddigitalisering ......................................................................................................................................... 45Indledning............................................................................................................................................................. 45Digitalisering af tekst og billeder....................................................................................................................... 45
2.4.12.4.22.5
Digitalisering af levende billeder................................................................................................................................... 47Indledning............................................................................................................................................................. 47Film ....................................................................................................................................................................... 47Video...................................................................................................................................................................... 48
2.5.12.3.22.5.3
3
Tilgængeliggørelse og formidling ................................................................................................493.13.23.33.4Indledning ...................................................................................................................................................................... 49Portaler og servicer ........................................................................................................................................................ 49Tilgængeliggørelse, metadata og it-systemer ................................................................................................................ 50Metadata ........................................................................................................................................................................ 51Behovet for metadata................................................................................................... 51Anvendelse af metadata............................................................................................... 51Standarder for metadata.............................................................................................. 53
3.4.13.4.23.4.33.53.6
Udveksling af metadata ................................................................................................................................................. 54Fælles infrastruktur....................................................................................................................................................... 55Indledning................................................................................................................. 55Lagring og håndtering – bitarkiv....................................................................................56Lagring og håndtering – objektniveauet.......................................................................... 57Arkitektur for tilgængeliggørelse................................................................................... 58Formidling................................................................................................................. 59Estimat for minimale udgifter til infrastruktur.................................................................61
3.6.13.6.23.6.33.6.43.6.53.6.6
4 Sammenfatning .......................................................................................................................................62
39
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
ForordEfter offentliggørelsen af Digitaliseringsudvalgets midtvejsrapport i september 2008 blev der nedsaten arbejdsgruppe, som skulle levere konkrete forslag til, hvilke dele af kulturarven der kunnedigitaliseres som led i en mere omfattende strategisk indsats for digitalisering af kulturarven.Sideløbende med dette arbejde har en undergruppe drøftet de tekniske afspekter af dennearbejdsgruppes forslag9. Formålet med arbejdet i denne tekniske undergruppe var at nuanceremidtvejsrapportens beskrivelse af digitaliseringsprocessen og infrastrukturen i lyset af de meredetaljerede forslag til, hvilke specifikke samlinger der kunne digitaliseres.Den tekniske undergruppe har således sammenholdt anbefalinger og beskrivelser framidtvejsrapporten med arbejdsgruppens konkrete forslag til digitalisering. Resultatet er en merenuanceret og detaljeret beskrivelse af digitaliseringsprocessen og et mere specikt økonomisk estimatfor omkostningerne ved etablering af den infrastruktur, der skal understøtte formidling af dendigitaliserede kulturarv.
1 IndledningDigitaliseringen af kulturarv er primært interessant på grund at de nye muligheder, som den giverdanskerne for at opleve kulturarven. Befolkningen får adgang til en kulturarv, som de ellers kun villemøde, hvis de fysisk opsøgte arkiverne og samlingerne, og den digitale form giver helt nye mulighederfor at præsentere og formilde kulturarven. Samtidig kan digitalisering bevare materiale, der ellersville være gået til grunde og bevare adgangen til audiovisuelt materiale, der bliver utilgængeligt i sinoriginale form, fordi afspilningsapparaturet forsvinder.Selve digitaliseringen er således et middel til at gøre kulturarven tilgængelig på lige fod med de øvrigedigitale tilbud, der bliver en stadig vigtigere del af hverdagen, ligesom digitaliseringen også tjener etbevaringsmæssigt formål. Selv om digitaliseringsprocessen – i et tilgængelighedsperspektiv – kansynes at spille en underordnet rolle, er en fornuftig tilrettelæggelse og gennemførelse af processen enforudsætning for, at brugerens udbytte af den digitale kulturarv bliver optimalt. Ud over en effektivdigitaliseringsproces er det afgørende, at det digitaliserede materiale efterfølgende kan bevares ogtilgængeliggøres gennem en effektiv infrastruktur, der kan understøtte de mangeformidlingsinitiativer, der gør brug af materialerne.Rapporten er opdelt i to overordnede afsnit: en beskrivelse af digitaliseringsprocessen samt enbeskrivelse af den efterfølgende tilgængeliggørelse og formidling. Afsnittet om digitaliseringsprocessenbeskriver problemstillingerne ved digitalisering af forskellige materialekategorier samt forslag til,hvordan de større institutioners kompetencer og erfaringer kan udnyttes i relation til specifikkematerialekategorier.
9
Medlemmerne af den tekniske undergruppe var: it-chef Arne Sørensen (Statsbiblioteket), vicedirektør Birte
Christensen-Dalsgaard (Det Kongelige Bibliotek), projektchef Tobias Golodnoff (DR Medier, Kulturarvsprojektet),museumsinspektør Thomas C. Christensen (Museum & Cinematek, Det Danske Filminstitut), fuldmægtig JakobBroberg Lind (Kulturministeriet) og kontorchef Jakob Heide Petersen (Styrelsen for Bibliotek og Medier).Rapporten er udarbejdet af gruppens medlemmer med bidrag fra institutionernes medarbejdere.
40
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Afsnittet om tilgængeliggørelse indledes med en beskrivelse af de generelle problemstillingervedrørende tilgængeliggørelse på internettet. Derudover redegøres for, hvordan materialettilgængeliggøres gennem tilføjelse af metadata, hvilke krav der kan stille til it-systemer, og hvordanen infrastruktur for bevaring og tilgængeliggørelse af den digitaliserede kulturarv kan etableres.
41
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
2 Digitaliseringsprocessen
2.1 IndledningEn optimal digitaliseringsproces forudsætter et indgående kendskab til den relevante materialetype ogden teknologi, der med fordel kan anvendes ved digitaliseringen. Det er afgørende, at processenresulterer i filer i den rigtige kvalitet og det rigtige format, så resultatet både kan anvendesumiddelbart og er fremtidssikret.Kulturministeriets institutioner benytter ofte udbud i forbindelse med større digitaliseringsopgaver,hvilket medfører, at en stor del af det praktiske arbejde udføres af eksterne aktører, ganske ofteplaceret i udlandet. Større digitaliseringsprojekter forudsætter således i den forbindelse betydeligekompetencer, både hvad angår tekniske aspekter, arbejdsprocesser, udbudsforretninger samtopfølgning og kvalitetssikring.Som beskrevet i det følgende har de større institutioner på Kulturministeriets område allerede dissekompetencer inden for de centrale materialekategorier, og institutionerne vil således kunne fungeresom kompetencecentre, såfremt der etableres en større tværgående digitaliseringsindsats. Udvalgethar dog ikke taget stilling til, hvorvidt der skal udpeges egentlige kompetencecentre; en sådanbeslutning vil bedst kunne tages i forbindelse med den konkrete implementering.Et væsentligt spørgsmål i forhold til alle digitaliseringsprocesser er komprimering af data. Somudgangspunkt er ukomprimerede formater (eventuelt pakkede ukomprimerede formater) atforetrække, men på grund af de større datamængder og dertil knyttede udgifter ved ukomprimeredeformater er der tale om en konkret afvejning fra digitalisering til digitalisering (ved digitalisering medbevaringsformål må ukomprimerede formater være et krav). Men afgørende er det under alleomstændigheder, at digitaliseringen finder sted via åbne, internationalt anerkendte standarder,således at materialet kan anvendes uafhængigt af platform.
2.2 Kompetencecentres rolle og opgaverSom det fremgår nedenfor, har de institutioner, der råder over store samlinger inden formaterialekategorierne lyd, tekst og billeder samt levende billeder, også omfattende erfaring meddigitalisering på området. Disse institutioner kan således i princippet fungere som kompetencecentreinden for en af de tre materialekategorier. Kompetencecentrene vil fungere inden for de eksisterendeøkonomiske rammer. Denne opgave indgår ikke på nuværende tidspunkt i institutionernesopgavebeskrivelse, men man anbefalede en lignende ansvarsfordeling for bevaring i forbindelse medudredning af bevaring om kulturarven10.
10
Udredning om bevaring af Kulturarven, Kulturministeriet 2003, side 207, se:
http://www.kb.dk/export/sites/kb_dk/da/kb/nb/bev/bevaring_af_kulturarven.pdf
42
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Kompetencecentret inden for en given materialekategori skal kunne rådgive andre offentligeinstitutioner om bevaring af materialet og indgå i partnerskaber samt evt. insourcedigitaliseringsopgaver.Kompetencecentret skal have ekspertviden om alle forhold omkring bevaring af materialet:Viden om de forskellige typer analoge medier inden for kategorierne:ooooopbevaring af medierne (magasinforhold, klima mm.)tilstandsvurdering og monitorering af samlingernes tilstandhåndtering af medierne ved brugrestaurering af skadede medier (f.eks. bånd under nedbrydning)
Viden om afspilningsudstyr til alle medietyper for lyd og levende billeder samt bevaring af detteudstyr:ooopbyggelse en samling af afspilningsudstyr, herunder reservedele for udstyr som er udgåetaf handel, der dækker i princippet alle medietyperekspertise i brug og vedligehold af afspilningsudstyr
Viden om digitalisering af medierne:ooooooooptimal overføring af materialet fra analogt medie til digital fil, herunder inspektion,klargøring/rensning af mediet, valg af udstyr (hvor det er relevant), kalibrering mv.formater til såvel langtidsbevaring som formidlingoptimale arbejdsgangedokumentation af digitaliseringsprocessenmetadata til såvel langtidsbevaring som formidlingfor lyd: efterbehandling (’rensning’) med henblik på formidlingeffektive digitaliseringsprocesser i form af f.eks. udstyr til masseproduktion oghøjhastighedsafspilning.
Kompetencecenteret kan være den institution, hvor man på nationalt plan har professionel viden ombevaring af materialet som kulturarv. Opgaven er helt overordnet at sikre, at museale ogbevaringsmæssige opgaver på medieområdet varetages i overensstemmelse med åbne, internationaltanerkendte arkivstandarder.Ovenstående opgaver bør i videst muligt omfang varetages iht. åbne, internationalt anerkendtestandarder og løbende udviklet i takt med nye tekniske muligheder. Dette kræver, atstandardiseringsarbejdet følges, samt at viden om tekniske forhold løbende ajourføres, bl.a. veddeltagelse i relevante internationale organer.Langtidsbevaring af en given materialetype bør være en opgave, der løses i fællesskab med andrekompetencecentre på nationalt og internationalt plan, idet digital langtidsbevaring generelt rummerproblemstillinger, der er fælles for stort set alle medietyper. Danmark deltager i øjeblikket i toeuropæiske projekter omkring digital langtidsbevaring – repræsenteret ved Det Kongelige Bibliotek ogStatsbiblioteket.
43
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
2.3 Digitalisering af lyd
2.3.1 IndledningSom det fremgår af digitaliseringsudvalgets midtvejsrapport (side 22), befinder hovedparten afkulturarvens lydmateriale sig på Statsbiblioteket og i DR. Statsbiblioteket huser StatensMediesamling, som er det nationale center for audiovisuelle materialer med ansvar for bevaring afdanske lydoptagelser. Lydsamlingen rummer 150.000 danske enheder og dækker indholdsmæssigt alt,hvad der er udgivet i Danmark på grammofonplader og bånd mv., ligesom en lang række unikkelydoptagelser fra samfunds- og kulturlivet i det 20. årh. indgår – enkelte helt tilbage fra lydhistoriensbarndom i slutningen af 1900-tallet.Hertil kommer komplette sendeflader med radiooptagelser fra DR fra de sidste 25 år (landsdækkendeog regionalt), samt en omfattende lokalradiosamling. Lydoptagelserne i Statens Mediesamling erlagret på medier af alle typer fra de sidste 100 år – fra fonografvalser, 78’-plader, trådruller,spolebånd, vinylplader, kassettebånd og DAT-bånd til cd’er. Mange af de nævnte medietyper findes ivarierende undertyper, som hver især kræver særligt afspilningsudstyr. Der modtages fortsatdonationer, idet Statsbiblioteket i kraft af sin medieopgave anses for det naturlige sted at afleverehistoriske lydoptagelser til.Historiske lydmedier findes også i andre kulturinstitutioner, der ikke har lydmedier somkerneområde, men hvor de indgår som et vigtigt supplerende kulturarvselement i tilknytning til decentrale samlinger. Blandt disse institutioner kan nævnes Det Kongelige Bibliotek, Nationalmuseet,Statens Arkiver, Dansk Folkemindesamling og Arbejderbevægelsens Bibliotek og Arkiv (seKulturarvsrapportens bilag 11). DR har endvidere i sine arkiver en del af de programmer, der gennemDR’s historie har været udsendt på de landsdækkende programmer. Der er for de ældre udsendelsersvedkommende overvejende tale om arkivering af enkeltudsendelser (ikke hele sendeflader).
2.3.2 DigitaliseringsprocessenDigitalisering af lyd kræver specialviden om samtlige medietyper, der har været på markedet igennemdet 20. årh. Lydoptagelserne i Statens Mediesamling og i de andre offentlige institutioner er for en stordels vedkommende lagret på konsummedier (ikke-professionelle formater), som ofte er slidte, fordi deer modtaget som donation (pligtaflevering af lydoptagelser blev først indført i 1998).Lydfæstninger er derfor det medie, som findes i flest forskellige formater. Blandt særligt skrøbeligetyper, kan nævnes:Voksvalser, som i princippet kun kan afspilles optimalt én gangAcetatplader, hvor overfladen pludselig kan krakelereSpolebånd, som har været udsat for uprofessionel håndteringDAT-bånd i proprietære formater.
I digitaliseringsprocessen er det vigtigt at have kompetencer og viden om optimal overførsel af lydenfra disse forgængelige medier til et digitalt format. Det drejer sig med andre ord om at kunne ’trække’så meget af den originale lyd ud af det analoge medie som overhovedet muligt. Dette er specielt
44
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
problematisk for de mange lydmedier, som igennem årene har været udsat for kemisk og fysisknedbrydning under opbevaring i privat eller offentligt regi uden kendskab til korrekteopbevaringsforhold.Statsbiblioteket har igennem de senere år arbejdet på etableringen af et kompetencecenter for lyd somet resultat af anbefalingen i Kulturarvsrapporten, dels ved rekruttering af sagkyndigt personale, delsved opbygning af erfaring igennem konkrete digitaliseringsprojekter. Biblioteket har sideløbende i etvist omfang udført rådgivningsopgaver – og i nogle tilfælde foretaget digitalisering af lydoptagelser forandre offentlige institutioner. Biblioteket får stadigt hyppigere henvendelse udefra om mulighed foroverspilning/rådgivning i digitalisering af historisk lyd fra f.eks. Naturhistorisk Museum,Kvindemuseet og Niels Bohr-arkivet.
2.4 Tekst- og billeddigitalisering
2.4.1 IndledningDer er en lang række institutioner, som har kulturarvsmateriale i form af tekst og billeder. Langtstørstedelen af de relevante samlinger inden for disse materialekategorier findes dog på Det KongeligeBibliotek.Det Kongelige Bibliotek er nationalbibliotek og universitetsbibliotek for Københavns Universitet.Nationalbiblioteksfunktionen blev etableret i 1648, medens universitetsbiblioteksfunktionen harrødder tilbage til 1482. Bibliotekets samlinger af tekst og billeder er meget omfattende. Biblioteket har6,9 mio. katalogiserede enheder tekst (bøger, tidsskrifter mv.) svarende til 175 hyldekilometer.Bibliotekets samlinger af fotografisk materiale mv. rummer 16,3 mio. enheder, svarende til 12,2hyldekilometer. Der findes også store samlinger af tekstmateriale i andre kulturinstitutioner og imindre omfang også fotografisk materiale. Blandt disse institutioner kan især nævnes Det DanskeFilminstitut, Kulturarvsstyrelsen, Nationalmuseet, Statens Arkiver, Statens Museum for Kunst ogStatsbiblioteket.
2.4.2 Digitalisering af tekst og billederDigitalisering af tekst og billeder falder i en række grupper:Digitalisering af forskellige kategorier af materiale, der kræver særlige kompetencer, eksempelvis:Sjældne dokumenter og værker, som ikke kan forlade institutionerSkrøbelige dokumenter og værker, som kræver meget stor viden om håndteringBøger, som må eller ikke må skæres op i ryggenSkanning baseret på mikrofilm.
Arbejdsgangene vil naturligvis afspejle hensyn til sådanne materialer. Arbejdsgangene må ligeledesafspejle mængden af allerede eksisterende metadata til materialet, samt afspejle beslutninger om,hvorvidt man vil foretage tekstgenkendelse af tekstmateriale og i bekræftende fald, om man tillige villave en opmærket version af materialet.
45
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Kravene og arbejdsgangene vil også afhænge af, om man efter digitaliseringen stadig har rådighedover den analoge original. De tilfælde, hvor originalen ikke er brugbar efterfølgende, taler man omsåkaldte substitutskanninger. Her skannes et objekt i stedet for at introducere ekstremt kostbarebevaringsforanstaltninger i forhold til originalen.Det er typisk for tekstdigitalisering, at man ofte arbejder med mange aktører: Materiale skannes etsted, tekstgenkendes et andet, opmærkes et tredje og kvalitetstjekkes et fjerde. Oven i disse kommerarbejdet med at beskrive og indlemme materialet. Der skal træffes en lang række beslutninger iforbindelse med digitaliseringen, herunder valg af opløsning, farvedybde og format (råt, komprimereteller pakket). Disse valg vil have stor betydning for den samlede pris for den efterfølgendebevaringsaktivitet.Et tekst- og billedkompetencecenter bør have den relevante viden i forhold til digitalisering ogbevaring af den del af kulturarven, som er udkommet på tryk eller forefindes som billeder (herunderogså negativer). Kompetencecentret kan bidrage til at sikre, at materiale digitaliseres i henhold tilåbne, internationalt anerkendte standarder, og rådgive om, hvordan man bedst og billigst gennemføreen konkret digitaliseringsopgave samt den digitale efterbehandling og kvalitetskontrol.Inden for tekstbaseret materiale er der allerede mange erfaringer både på Det Kongelige Bibliotek ogved en række andre biblioteker og institutioner i Europa og USA. Disse spænder over modeller med enmeget arbejdskraftsintensiv, selektiv digitalisering af enestående værker til mere automatiseretmassedigitalisering af hele samlinger. Inden for massedigitalisering er en alliance med Google enmulighed, som flere større forskningsbiblioteker har benyttet sig af. Samarbejdet finder sted underden forudsætning, at materialet efterfølgende kun kan benyttes af den institution, der råder oversamlingen. Det ville i det Kongelige Biblioteks tilfælde indebære, at kun lånere ved KB kunne benyttematerialet efterfølgende.Flere firmaer er begyndt at tilbyde alliancer, herunder Internet Archive, som tilbyder at lave denefterfølgende digitale behandling, hvis institutionen selv står for skanningen. Det tyske firma CSS haren arbejdsgang, hvor digitalisering også gennemføres lokalt, men hvor den efterfølgendekvalitetskontrol er outsourcet til Asien.Det Kongelige Bibliotek har i mere end 10 år arbejdet med digitalisering af egne materialer, i de sidste4 år har KB digitaliseret for andre institutioner. Biblioteket har derved opbygget viden og erfaringvedrørende skannere, software, applikationsudvikling, arbejdskraft, definition og styring af opgaversamt outsurcing af opgaver. Fokus har været på digitalisering af materialer inden for tekst og billeder.Der er stor spredning og kompleksitet i bibliotekets digitaliseringsprojekter, hvilket har medvirket tilopbygning af omfattende ekspertise på området. Der arbejdes med alle kvaliteter af materialer både iform af fysisk materiale, der skal digitaliseres, og i form af det output, som er resultatet afdigitaliseringsprocessen.Det færdige resultat afhænger af formålet. Biblioteket har opgaver, der varierer meget i størrelse frafå hundrede sider til over 100.000 sider, hvilket har medvirket til opbygning af viden omkringworkflow og optimering af disse.Det Kongelige Bibliotek har gennem 5 år benyttet sig af outsourcing på næsten alle områder afdigitaliseringsprocessen, undtagen selve skanningen. Derved har biblioteket høstet erfaringer med,hvilke faktorer der er afgørende for at opnå den ønskede effekt af outsourcingen. Det vigtigste er, atudbyder har et indgående kendskab til opgaven, dvs. institutionen har tilstrækkelig viden til selv at
46
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
løse opgaven, så den kan udarbejde de rette kravspecifikationer. Hvis ikke denne ekspertise er tilstede, risikerer man, at besparelsen ved outsourcing udebliver. Det Kongelige Bibliotek har outsourcetopgaver til Rumænien, Iran og Indien og tidligere også benyttet Rusland. Erfaring med tidligereprojekter gør det muligt at placere nye opgaver de steder, der kan tilbyde den rette pris og derelevante kompetencer til netop den opgave.Uanset institutionens nuværende kompetencer og erfaringer er det afgørende, at man løbende holdersig orienteret ikke bare om de teknologiske muligheder, men også om, hvordan andre institutionerløser opgaven og til hvilken pris. Det Kongelige Bibliotek har et meget veludviklet kontaktnet til såvelde andre nationalbiblioteker som til de andre institutioner, som har store bog-, dokument- ellerbilledsamlinger. Blandt dem, som biblioteket aktivt udveksler erfaringer med, kan nævnesnationalbibliotekerne i Frankrig, Holland, England og Østrig, som alle er i gang med omfattendedigitaliseringsopgaver
2.5 Digitalisering af levende billeder
2.5.1 IndledningDet Danske Filminstitut (DFI) er den nationale bevaringsinstitution for film. Samlingen omfatterfilmmaterialer på filmbase, såsom de brandfarlige 35 mm nitratfilm, til moderne produktioner pådigitale masters. Filminstituttet er kompetencecenter for bevaring og restaurering af film. Inden for desidste 10 år er faciliteterne til opbevaring af film blevet opgraderet til tidssvarende niveau gennemkonstruktion af nye arkiver med klimaforhold, der sikrer en levetid på 500 år til analogefilmmaterialer. Da driften af filmlaboratorier kræver en vis volumen, benytter Filminstituttet siginden for filmkopiering og film til video-transfer af outsourcing til eksterne speciallaboratorier.Kopiering mellem videoformater er en aktivitet, både DFI og DR besidder faciliteter til, men størrekopieringsprogrammer udliciteres typisk til eksterne leverandører.Det er nødvendigt at kategorisere levende billeder i to undergrupper: film og video. Ligeledes er det pågrund af de levende billeders fysiske omfang, i endnu højere grad end for andre materialetyper,hensigtsmæssigt at operere med forskellige formater til master-/bevaringsbrug og formidlingsbrug.
2.3.2 FilmDer anslås ikke i dag at være noget digitalt alternativ til bevaring af analoge filmbilleder. Biograffilmpostproduceres ofte digitalt, men distributionen forgår endnu typisk på 35 mm analog kopi, ligesom etudskudt analogt filmmateriale fra de digitale filer anses som det eneste langtidsholdbare medie.Filminstituttet restaurerer udvalgte titler digitalt, hvor slutresultatet er et analogt 35 mm negativsamt en HD-version til digital brug. Filmmateriale i god stand kan opbevares i århundreder underforudsætning af optimale fysiske forhold (5 grader Celsius, eller mindre, samt relativ fugtighed på35 %).Der er ikke i skrivende stund et standardiseret digitalt filmformat. Det forventes, at 2K (1920x1080)eller 4K (4000x2000) mpeg2000-filer vil blive fremtidens biografformat. Udfordringerne ved fremtidensbiograffilmformater understreges ved, at en 4K ukomprimeret digital filmmaster fylder 4TB per time.Filminstituttet digitaliserer typisk film til HDSR, HDCAM og Digital Betacam, der alle har lavere
47
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
opløsning end den originale film. I denne rapport vil der for digitalisering af levende billeder blivebeskrevet processer, der overfører film eller videoformater til et videomasterformat, samtdigitalisering af disse videomastere til filbaserede videosystemer. Da den primære brug forventes atvære til webbrug og broadcast, opereres med en forventning om at overføre film til High Definitiontape (HD), 1080x1920 pixel, med en efterfølgende digitalisering til filbaserede systemer.Scanning/digitalisering af film er en håndteringsmæssigt krævende proces. Det originale materialeskal behandles med varsomhed, da det er originalt bevaringsmateriale. Der er tale om skrøbeligeoriginaler, der kræver kompetent fysisk håndtering, ligesom kopieringen kræver en farvekorrigering,der er specialistarbejde. Både udstyr og mandskab er kostbart. DR har in house-faciliteter ogkompetence til overførsel af film i god stand til video, mens DFI benytter sig af eksterne laboratoriertil både film til filmkopiering samt til digitalisering af film til video. Især for ældre materialer er detsvært at effektivisere kopieringsprocesserne, der er arbejdsintensive. Da indholdet skal lyssættes iforbindelse med kopiering, påregnes i omegnen af 4 timer per times indhold til denne proces alene.Hertil kommer fysisk klargøring af materialet før kopiering og efterfølgende digitalisering ogkonvertering til relevante brugsformater.
2.5.3 VideoAnalog video er under hastig udfasning efter ca. 40 år på markedet. Da ethvert videoformat rent fysiskhar en holdbarhed på 10-20 år, er mange bånd under akut fysisk nedbrydning. Apparaturet tilafspilning er desuden sjældent og svært at vedligeholde i optimal stand. Overførsel til digitalevideoformater er den eneste bevaringsmulighed. Filminstituttet anser i dag Digital Betacam som detmest holdbare medie til Standard Definition (SD) video. Der er mange faldgruber i digitalisering afanalog video. Ikke alene er det en teknisk kompliceret opgave, men typisk er analog video i formatet4:3, mens moderne digital video er 16:9, hvilket kræver formatmæssige valg, der aldrig er optimale. Etalternativ er digitalisering med bibeholdelse af det originale format (4:3). Der er endnu ikke sket enmodning eller de facto-standardisering af digitale videoformater på masterniveau. Eksisterendeløsninger er derfor i vid udstrækning enten proprietære eller baseret på individuelle løsninger.Filminstituttet benytter digital video som bevaringsformat for SD- og HD-video, herunderbåndformaterne HDSR og Digital Betacam, der af DFI betragtes som de mindst ringe lagermedier.Digitale videobånd har en forventet levetid på ca. 15 år under gode opbevaringsforhold (8C/35%RF).Som for analog video vil en fremtidig løsning formodentlig blive migrering/konvertering til jpeg2000eller lignende filformat. Som bevaringsformat vil ukomprimerede billeder blive foretrukket, hvilketkræver ca. 100 mbs, svarende til 60GB per time for SD samt ca. 4 gange så meget for HD.Det er værd at bemærke, at DFI har en høj grad af fokus på de bevaringsmæssige aspekter, mensDanmarks Radio også lader produktionsmæssige forhold spille ind. DR har eksempelvis valgt etdigitalt SD-format, DVCPro50, der ikke indebærer den højest mulige kvalitet. DR har ved valget af etfilbaseret system optimeret produktionsgangene og forventer at fremtidig migrering af indhold vilkunne ske automatisk og uafhængigt af individuel håndtering af materiale.Digitalisering til lettere håndterbare intermediate ”masters”, såsom AVI 6mbs, hvorfra flash-filer ellerlignende kan genereres til webbrug, er ikke som sådan en kompliceret proces, men vil logistikmæssigtvære vigtigt at få beskrevet, så de samarbejdende institutioner kan digitalisere video på en homogenog effektiv måde på tværs af institutionerne.
48
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
3 Tilgængeliggørelse og formidling
3.1 IndledningInternettet er det vigtigste medie til at give brugerne adgang til den digitaliserede kulturarv. Nettesalsidighed og udbredelse giver helt nye muligheder for at forbinde brugere og kulturarv. Internettetsomfang og overflod af information giver dog samtidig en række udfordringer, hvis man skal sikre, atden digitaliserede kulturarv er synlig for brugeren, og at brugeren finder frem til det relevantemateriale.Den første forudsætning, for at brugerne kan anvende den digitale kulturarv, er at den er tilgængeligvia internettet. Tilgængeliggørelse kan i denne sammenhæng defineres som en eksponering afmaterialet på en måde, der giver slutbrugeren mulighed for at få adgang til materialet via internettet.Der er tale om en mere passiv præsentation af materialet end decideret formidling, hvor materialetpræsenteres i en kontekst, der formodes at være relevant for brugeren eller for et givent emne.Tilgængeliggørelsen kan bestå i, at brugeren gennem en søgning f.eks. via Google kan fremfinde noglefå oplysninger om materialet med et link til selve det digitaliserede billede, lydklip, video ellerlignende. Formidlingen kan eksempelvis være formidling af materialet gennem en portal eller enskræddersyet præsentation til en given målgruppe.
3.2 Portaler og servicerSondringen mellem tilgængeliggørelse og formidling er blevet mere relevant, efterhånden som brugerei de senere år i højere grad anvender nogle få søgemaskiner til at finde information på internettet. Enstor del af den tidlige webformidling bestod i opbygningen af portaler, der ofte risikerede at bliveforbigået af brugerne, hvis ikke brugerne i forvejen havde kendskab til portalerne, eller hvis ikkeindholdet fra portalerne dukkede op i søgemaskinerne.Med søgemaskinerne og især Googles udbredelse blev det efterhånden set som vigtigere, at materialetvar tilgængeligt og synligt for søgemaskinerne frem for gennem en portal, som brugerne måske ikkefandt frem til. Den udvikling skyldes i høj grad den øgede informationsmængde på internettet: Der varen overflod af information, som var vanskelig at formidle i et struktureret portalunivers. Portalernemistede efterhånden deres monopol som indgange til information, og man talte om en bevægelse fra”content is king” til ”context is king”. Man satsede i højere grad på at gøre materialet tilgængeligt iden kontekst, brugeren befandt sig i, frem for at forsøge at lokke brugeren til et bestemt sted påinternettet.Desuden havde mange portaler et bestemt formidlingsperspektiv, der ofte var megetafsenderorienteret og tog udgangspunkt i et bestemt emne eller en bestemt institution. Portalernehavde i mange tilfælde også en ret lukket struktur både i forhold til andre tilbud på nettet og i forholdtil interaktionen med brugerne. Sådanne portaler er blevet beskrevet som ”walled gardens” medproprietært indhold – de tilbød brugerne en helt bestemt service inden for meget afgrænsede rammer.
49
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
En stor del af den nyere webformidling fremhæver vigtigheden af, at brugeren kan møde materialet isin daglige adfærd på nettet, og at formidlingen inddrager brugeren i størst muligt omfang. Detbetyder, at man fortsat kan arbejde med portaler, der tager afsæt i bestemte brugergrupper elleremner, men at disse portaler ofte er mere åbne i deres struktur. Man stiller således ofte indholdet tilrådighed som servicer, som andre websites kan anvende til at supplere egen formidling (f.eks. viaRSS). I den forbindelse har institutioner f.eks. på kulturarvsområdet ofte gennem deres kendskab tilbrugerne og deres specifikke behov mulighed for at sikre, at formidlingen tilrettelægges på en måde,der tilgodeser brugerens behov.Ofte bestræber man sig på at sikre, at metadata optræder i flest mulige sammenhænge, således atbrugerne har flere chancer for at møde materialet gennem sine foretrukne websites ellersøgemaskiner. Denne nyere webformidling er i høj grad understøttet af en række nye teknologier somwebservicer, RSS-feeds og mere lette og dynamiske webprogrammeringsværktøjer og hele det nytparadigme omkring web 2.0.Udviklingen betyder, at digitalt kulturarvsmateriale vil kunne anvendes på helt nye og uventedemåder, når det gøres tilgængeligt på internettet. Den betyder dog også, at det er vanskeligt at udfoldeen samlet formidlingsvision – f.eks. i form af én bestemt portal eller ét færdigt brugerscenarie. Det erbaggrunden for, at skildringen af formidlingen består af eksempler.Den teknologiske udvikling har dog medført, at det er langt lettere og billigere end tidligere at laveformidling via internettet, og at der er langt flere eksisterende formidlingskanaler, hvor materialetkan finde anvendelse og skabe værdi. Det er baggrunden for, at der i det følgende er forholdsvis storvægt på tilgængeliggørelse frem for formidling.
3.3 Tilgængeliggørelse, metadata og it-systemerDen konkrete tilgængeliggørelse af den digitaliserede kulturarv stiller både krav til it-systemerne ogden måde, materialet er beskrevet på:De systemer, der indeholder det digitaliserede materiale og oplysningerne om materialet(metadata), skal være forbundet med internettet.Systemerne skal kunne udveksle information om materialet med andre systemer via åbnestandardprotokoller.Materialet skal være beskrevet med metadata og/eller kunne indekseres af søgemaskiner.
Den mest simple model for fælles tilgængeliggørelse består i, at de lokale systemer understøtterstandardprotokoller for dataudveksling, at der anvendes standardiserede metadata, og at metadatahøstes til en fælles database, som brugeren kan søge i. Det er den model, som i midtvejsrapporten blevbeskrevet som simpel søgning (side 64).I midtvejsrapporten blev modellen fravalgt til fordel for en mere omfattende model med integreretsøgning. Den infrastruktur, der beskrives her, vil som minimum tilbyde samme funktionalitet som densimple model for fælles tilgængeliggørelse.
50
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
Der arbejdes i nærværende rapport med en nuancering af anbefalingerne i midtvejsrapporten. Denvæsentligste forskel mellem anbefalingerne i denne rapport og midtvejsrapportens anbefalinger ervægtningen af løsningen med integreret søgning. Der er i denne rapport mindre fokus på integreretsøgning, fordi en del af de materialer, som foreslås digitaliseret i hovedrapporten, med fordel kanformidles på andre måder. Integreret søgning er baseret på indeksering af digitalt indhold – pånuværende tidspunkt primært tekst. Billeder og levende billeder vil på nuværende tidspunkt ikkekunne formidles væsentligt bedre med integreret søgning, og da en stor del af det foreslåede indhold eromfattet af disse kategorier, er fokus flyttet til andre formidlingsformer.
3.4 Metadata
3.4.1 Behovet for metadataMetadata er ”data om data” og altså i denne sammenhæng en beskrivelse af det digitaliseredemateriale. En åben og struktureret beskrivelse af viden om alle objekterne i den digitaliseredekulturarv ville give optimale forudsætninger for tilgængeliggørelse. Således ville en beskrivelse afmetadata ud fra ”topic maps” give gode forudsætninger for at søge på tværs af samlinger, ligesom detvil udgøre et godt grundlag for blandt andet tematiske formidlingsinitiativer.Det er desværre særdeles omkostningskrævende at udføre manuelle beskrivelser af de mange digitaleobjekter. Det ville således formentlig være mere omkostningskrævende manuelt at beskrive de 700.000luftfotos fra Det Kongelige Biblioteks Sylvest Jensen-samling, end det ville være at digitalisere dem.Omvendt kan det være meget vanskeligt og måske endda umuligt for en bruger at finde frem til etbillede, hvis der ikke er tilknyttet beskrivende data. Metadata kan altså være forudsætningen for, atdet digitale objekt overhovedet bliver anvendt, men samtidig være omkostningskrævende.Hvis metadata skal udarbejdes som led i en manuel proces, bliver det meget vigtigt at afgrænsemetadata til de mest nødvendige data for ikke at gøre digitaliseringen prohibitivt dyr. Der skal altså inogle tilfælde foretages en afvejning mellem ønsket om righoldige metadata og udgifterne ved atproducere dem.I mange tilfælde kan man imidlertid tilknytte beskrivende data til de digitaliserede objekter uden atskulle gøre det manuelt. Man kan således hente metadata fra andre registre, f.eks. bibliotekerneskataloger og museers og arkivers registre. Digitaliseringen vil her udnytte de beskrivende data, derallerede findes om de fysiske genstande. Disse metadata er dog ikke oprindeligt skabt med henblik pådigitalisering eller tværgående tilgængeliggørelse. Det betyder, at de ikke er ensartede på tværs afsamlinger og på tværs af sektorer (f.eks. biblioteker, arkiver og museer). Generelt bør eksisterendemetadata (protokoller og kartoteker mv.) digitaliseres så fyldigt som muligt med henblik på at undgåtab heraf.
3.4.2 Anvendelse af metadataNår anvendelsen af metadata varierer på tværs af samlinger og sektorer, skyldes det naturligvis, atmetadata ofte kræver økonomiske ressourcer, og at man derfor ikke anvender flere metadata endformålet tilsiger. Det oprindelige formål med beskrivelsen af kulturarvsobjekter har oftest været
51
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
afgørende for valg af metadata. Afhængigt af formålet med at tildele metadata til fysiske objekter i ensamling kan der således anvendes mange forskellige typer metadata, f.eks.:bibliografiske (f.eks. ”billede af Eiffeltårnet taget af NN”)11administrative (f.eks. ”taget den 19/04/2005”)juridiske (f.eks. ”ophavsretligt beskyttet”)bevaringsmæssige (f.eks. ”skal vises som jpeg”)tekniske (f.eks. ”jpeg-format"; "85.8kb fil”)uddannelsesmæssige (f.eks. “En illustration af en jernkonstruktion”; Folkeskolen 8.klassetrin”)strukturelle (f.eks. ”enkeltstående billede”).
Afhængigt af, hvilken type metadata der anvendes, kan man anvende forskellige standarder. Der ersåledes eksempelvis en fælles standard for bibliografiske metadata på biblioteksområdet. Daanvendelsen af metadata er bestemt at formålet med beskrivelsen, kan man naturligvis ikke forvente,at de metadata, som kulturarvsinstitutioner anvender til at beskrive genstande i deres samlinger, erhelt ens eller har indtænkt alle fremtidige benyttelser af genstandene.Et godt eksempel er anvendelsen af digitaliseret kulturarv i undervisningssammenhænge. Påundervisningsområdet anvender man en standard, SCORM (Sharable Content Object ReferenceModel), som er en standard for, hvilke informationer og data et læringsobjekt skal indeholde, før detkan eksporteres mellem SCORM-kompatible uddannelsessystemer. Man kan naturligvis anvendedigitaliseret kulturarv til undervisningsbrug uden for disse systemer, men i nogle sammenhænge vildet være en fordel at følge standarden. I de tilfælde vil det formentlig være hensigtsmæssigt at lade deinstitutioner, der ønsker at udnytte objekterne, tilføre flere og andre metadata. Det vil imidlertid værehensigtsmæssigt, at kulturarvsinstitutionerne overholder fælles standarder og minimumskrav tilmetadata, jf. nedenfor.Anvendelse af eksisterende metadata for fysiske objekter og manuel beskrivelse af digitale objekter erimidlertid ikke de eneste kilder til metadata. En tredje mulighed er at udnytte selve digitaliseringen ibeskrivelsen. Når materialet digitaliseres, er der i nogle tilfælde mulighed for at gøre brug afautomatisk dannede metadata såsom informationer trukket ud de digitaliserede filer eller afkonteksten ved høstning. Det kan dels være tekniske og dels indbyggede beskrivende metadata (f.eks. ihtml, xml, word og pdf). En digitaliseret tekst kan således både fungere som digitalt objekt og somkilde til metadata. Søgemaskiner kan f.eks. indeksere en digital tekst og derved gøre det muligt atsøge i selve teksten frem for blot i beskrivende elementer. Dette medfører dog ofte problemer medensartethed i stil med de problemer, der knytter sig til uensartede metadata. Der arbejdes med atudvikle automatiseret indeksering og søgning i lyd og billeder, men langtfra med de søgemuligheder,der findes for tekst.Metadata kan også hentes fra den sammenhæng, som materialet optræder i. Der kan tilføres flereoplysninger om et givent materiale ved at sammenholde det med materialer, der har beskrivendeelementer tilfælles med dette materiale, men derudover mere righoldige beskrivelser på andreområder.
11
Eksemplet er hentet fra:http://mandate.cdlr.strath.ac.uk/metadata.htm
52
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
En fjerde mulighed for at få digitaliseret materiale beskrevet med metadata er at få brugerne til atmedvirke ved beskrivelsen af materialet. Flyfotos, hvor man blot kender den geografiske lokalitet,eller portrætter, hvor man blot kender et navn, kan typisk tilføres mere righoldige beskrivelser ved atlade brugeren bidrage.
3.4.3 Standarder for metadataDer findes en række standarder for metadata, både mere generelle og helt specifikke. I Danmarkanvendes således en række nationale og institutionsspecifikke specifikationer for metadata. For atunderstøtte en fælles præsentation af data fra arkiver, biblioteker og museer blev der i 2007 publiceretet sæt specifikationer, som definerer et Dublin Core-baseret fælles format12. Udgangspunktet var nogleregionale initiativer for samarbejde om metadata, og specifikationerne er sideløbende med udviklingenanvendt afwww.arkibas.dk.I forbindelse med EDLnet (forberedelse afhttp://www.europeana.eu/)harStyrelsen for Bibliotek og Medier i et notat beskrevet en enkel omsætning fra dette fælles danskeABM-format til basis-eksportformatet til Europeana13.Anvendelse af fælles format vil gøre det lettere at eksponere data i både nationale systemer,søgemaskiner og i Europeana. Desuden vil en standardiseret anvendelse af data fremme tværgåendeformidlingsinitiativer. Der bør derfor som minimum stilles krav om anvendelse af Dublin Core-baseret12
Det mest anvendte format for metadata kaldes Dublin Core og omfatter som udgangspunkt 15 elementer som
f.eks. titel, forfatter/ophav, emne/nøgleord, beskrivelse, udgiver og anden bidragyder. Betegnelsen Dublin Coreskyldes, at formatet blev udarbejdet i byen Dublin, Ohio, og core referer til, at der er tale om en kerne afbeskrivende metadata, der kan udvides.13
Danske standarder
Specifikationer for fælles præsentation af data fra arkiver, biblioteker og museer på internettet ved ABMstandard-arbejdsgruppen nedsat af Statens Arkiver, Biblioteksstyrelsen og Kulturarvsstyrelsen:http://www.bs.dk/standards/abm/(omtales ofte som ABM standarden)ARKIBAS 4:http://www.danskearkiver.dk/Arkibas/Oma4.htmDAISY. Dansk Arkivalieinformationssystem:http://daisy.sa.dk/danMARC2. Edb-format til inddatering og udveksling af bibliografiske data i maskinlæsbar form:http://www.kat-format.dk/danMARC2/Regin: Baggrunden for Dansk Museums Dokumentations Standard:http://www.kulturarv.dk/forvaltning/museumsdrift/vejledninger/registrering/standard/baggrund.jspInternationale standarderRelevante internationale standarder:EAD – Encoded Archival Description:http://www.loc.gov/ead/EBU Core Metadata Set:http://www.ebu.ch/metadata/documentation/EBUCore/tec_doc_t3293_2008_FinalDraft.pdf(radio- og tv-arkiver)DCMI Metadata Terms:http://dublincore.org/documents/dcmi-terms/(Dublin Core 1.1. supplereret mederfinements mv.)ISO 15836:2003 Information and documentation - The Dublin Core metadata element set. Se også: DCES, version1.1:http://dublincore.org/documents/dces/ISO 21127:2006 Information and documentation – A reference ontology for the interchange of cultural heritageinformation. Se også: CIDOC CRM – Conceptual Reference Model:http://cidoc.ics.forth.gr/MARC21:http://www.loc.gov/marc/marc.htmlPREMIS Preservation Metadata:http://www.loc.gov/standards/premis/UNIMARC:http://www.unimarc.net/unimarc-formats.htmlVRA Core:http://www.vraweb.org/projects/vracore4/index.html(visuelt materiale)
53
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
fælles format ved anvendelse af strukturerede metadata. Som nævnt ovenfor vil der i nogle tilfældekunne hentes flere metadata, og det bør naturligvis udnyttes i det omfang, hvor det er muligt. I andretilfælde vil det være hensigtsmæssigt at lade brugerne bidrage til beskrivelsen af objekterne. I detilfælde kan det derfor være fornuftigt at fravige kravet om anvendelse af et standardiseret format.Man kunne forestille sig, at anvendelse af fælles ABM-format blev en bevillingsforudsætning, som kunfraviges, hvis institutionen kan begrunde en undtagelse.
3.5 Udveksling af metadataUdveksling af metadata mellem digitale arkiver bør foregå over standardprotokoller og istandardformater. Den nok mest udbredte standard for udveksling af metadata er den såkaldte OAI-PMH-standard14. OAI-PMH 2.0 anbefales af Europeana som basis for udveksling af simple metadatamellem indholdsleverandører og Europeana15.Standard OAI-PMH er udviklet til at høste forholdsvis simple metadata i Dublin Core (unqualified),men standarden tillader også at udstille andre metadata i andre formater (andre såkaldtemetadataPrefix). OAI-PMH kan således også bruges til udveksling af metadata i andre formater, f.eks.METS, MPEG21, MARCXML, PB-CORE. Bruges OAI-PMH til dette, kræves det naturligvis atafsender og modtager er enige om, hvilke metadataformater der udvekslesStandard unqualified Dublin Core rummer 15 felter, og disse kan beskrive de fleste data til de flestebrugsscenarier. Der er bibliografiske metadata som f.eks. ophav, medvirkende, emneord og tid samtadministrative metadata som f.eks. rettigheder. Der bør skrives en anbefaling til, hvorledes flere afDublin Core-felterne anvendes, og en standard for, hvordan eksempelvis rettigheder angives.Google stoppede desværre i begyndelsen af 2008 support for OAI-PMH til fordel for en ny standard,XML Sitemaps16. Begrundelsen for at stoppe denne understøttelse var, at Google vurderede, at OAI-PMH var utilstrækkelig til Googles behov som søgemaskine. Desuden mente Google, at OAI-PHM ikkevar tilstrækkelig udbredt uden for de miljøer, hvor man arbejder med repositories (digitale arkiver) til,at de kunne fortsætte understøttelsen. XML Sitemaps er en langt simplere standard, udviklet merespecifikt til at udstille indhold (udelukkende udtrykt i URL’er) over for søgemaskiner. Denne standarder således ikke egnet til udveksling af metadata mellem arkiver, men såfremt søgemaskinerne er målfor metadata, bør arkiver kunne udstille deres indhold også i XML Sitemaps.OAI-PMH har en standardmodel til simpel udveksling af simple metadata i form af Dublin Core simple(15 kerneelementer) – eksempelvis et sæt metadata til en digital fil. Moderne repositorysystemer ogarkiver bruger mere avancerede og ofte objektorienterede datamodeller til at beskrive sammenhængemellem grupper af metadata og filer samt relationer mellem såvel grupper som enkeltobjekter.Relationer kan godt beskrives i unqualified Dublin Core vha. DC:Relations, men her er udelukkende
14
OAI-PMH – Open Archives Initiative Protocol for Metadata Harvesting:
http://www.openarchives.org/OAI/openarchivesprotocol.html15
http://www.europeana.euhttp://www.sitemaps.org/protocol.php
16
54
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
mulighed for at angive links (URL’er) til andre objekter, og det kan således ikke angives, hvilkenrelation der er tale om. Men OAI-PHM kan også anvendes til udveksling af andre metadatamodeller ogdermed også for avancerede datamodeller.For at understøtte udveksling af metadata mellem digitale arkiver, der bruger avancerede da-tamodeller, har samme organisation, som stod bag OAI-PMH, de seneste år udviklet en ny standard,OAI-ORE. OAI-ORE er netop i oktober 2008 udkommet i version 1.0 og findes således nu i en stabilversion.Til indsamling af metadata til Europeana forventes fortsat anvendt OAI-PMH. I prototypen anvendesinternt aktuelt et format med knap 50 elementer hentet både fra de 15 Dublin Core-kerneelementer ogfra metadata fra supplerende indberetninger i faglige formater som f.eks. bibliotekernes MARC-formater. I den kommende operationelle udgave af Europeana planlægges anvendt en interndatamodel, der er udviklet over samme koncepter som OAI-ORE med brug af begreber som surrogatesog aggregations. Der er aftalt et samarbejde mellem OAI-ORE og Europeana om udviklingen afstandarder. Europeana skriver selv: ”Thisinternal recursive structure of EDL surrogates is similar tothe OAI-ORE [80] surrogate model and is intended to evolve in line with it.”17Med OAI-ORE kan man således udstille grupper af data og metadata som samlede helheder i såkaldteRessource Maps. Et Ressource Map har metadata om hele gruppen af objekter samt struktureredelinks til delelementer og i øvrigt mulighed for links til andre grupper såvel internt i samme arkiv someksternt. Relationer kan i OAI-ORE beskrives f.eks. med RDF – et udbredt framework tilrelationsbeskrivelse udviklet til semantisk web.Da OAI-ORE således synes at kunne blive standarden for beskrivelse af komplekse data, børstandarden undersøges yderligere og udviklingen følges nøje.Konkluderende er anbefalingen således pt. 3-strenget:1.2.3.Brug OAI-PMH for at være på linje med EuropeanaBrug XML Sitemaps, såfremt metadata skal udstilles for GoogleFølg med i udviklingen af OAI-ORE for at være fremtidssikret.
3.6 Fælles infrastruktur
3.6.1 IndledningSom beskrevet i midtvejsrapporten behøver en fælles infrastruktur ikke at indebære, at der etableresét centralt datacenter; infrastrukturen kan være fælles men distribueret på flere geografiskelokaliteter og institutioner. I det følgende skelnes der imidlertid ikke mellem en distribueret og encentral infrastruktur. Dog er de økonomiske estimater udarbejdet på grundlag af en centralinfrastruktur, der ud fra et umiddelbart skøn vurderes at være den mest omkostningseffektive.Udvalget ser sig dog ikke i stand til på det foreliggende grundlag at komme med en anbefaling om,
17
EDLnet - D2.2-Initial Semantic and Technical Interoperability Requirements
55
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
hvorvidt der bør etableres en central infrastrukturløsning – det må vurderes gennem en nøjereovervejelse i forhold til et specifikt digitaliseringsscenarie.Det bemærkes, at udgifterne til infrastruktur på grund af den løbende teknologiske udvikling underalle omstændigheder er meget vanskelige at fremskrive, især over en længere årrække.Beskrivelsen at en mulig fælles infrastruktur tager udgangspunkt i Gartner Groups anbefaling tilsystemarkitektur for løsningsdesign i midtvejsrapporten (side 67). Her deles systemarkitekturen i 3niveauer:1) Et nederste niveau bestående af lagring og håndtering2) Et mellemniveau bestående af tilgængeliggørelse3) Et øverste niveau bestående af formidling.
3.6.2 Lagring og håndtering – bitarkivStatens Arkiver, Det Kongelige Bibliotek og Statsbiblioteket samarbejder allerede om løsninger, dersikrer den fysiske bevaring af de digitale materialer, de hver især har ansvaret for: Statens Arkiverhar data på egne installationer og er i færd med at etablere en geografisk og mediemæssig redundansaf disse data på Statsbiblioteket i Århus. Netarkivet ved Statsbiblioteket og Det Kongelige Bibliotekhar replikeret sine data på geografisk adskilte installationer i hhv. København og Århus.Statsbiblioteket har sine øvrige data replikeret mellem Statsbibliotekets forskellige adresser i Århus,mens Det Kongelige Bibliotek er i færd med at replikere sine øvrige data til Statsbiblioteket eftersamme model, som anvendes i Netarkivet.De tre institutioner har igangsat et fælles initiativ, som skal undersøge rammerne for at etablere enfælles løsning, hvor data kan bevares med forskellige niveauer for administrativ, organisatorisk ogfysisk sikkerhed. Initiativet vil løfte dette samarbejde op på et sikkert fagligt niveau af internationalstandard. Det er hensigten, at strategien efterfølgende skal danne grundlag for indgåelse af etforpligtende samarbejde mellem parterne omkring etablering og drift at et nationalt bitarkiv.Infrastrukturen og omkostningerne ved et fælles bitarkiv for den digitaliserede kulturarv kanbeskrives på baggrund af erfaringerne med en lignende løsning, som er etableret hos Statsbiblioteket,og som i et vist omfang også anvendes af Det Kongelige Bibliotek og Statens Arkiver. Løsningenshovedkarakteristika er:Hver enhed (fil) findes i 3 fysisk adskilte kopier hvoraf mindst én er en onlineversion.Sikkerhedskonceptet håndteres efter DS484, skærpet på enkelte punkter.Det anvendte udstyr er traditionelt datacenterudstyr med diske og båndrobotter.Udstyret er anskaffet gennem EU-udbud i 2006, som løbende giver mulighed for at suppleremed kapacitet frem til udgangen af 2009 (kan forlænges til 2012).Størrelsen pr. 1. oktober 2008: 600 Terabyte.
Som indikation for omkostningerne vælges den løsning, der anvendes i Statsbibliotekets og DetKongelige Biblioteks fælles projekt, Netarkivet. Løsningen anvender ovennævnte udstyr og arkitekturpå Statsbiblioteket og er derudover udvidet med flere af de ekstra sikkerhedskrav, der forudses at
56
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
være relevante for et egentligt fælles bitarkiv. Løsningen for Netarkivet består således af 3eksemplarer af hver fil, hvor de 2 er onlineversioner, med den ene placeret på Det Kongelige Bibliotek.KB+SB priser, prognose for TB priser iNetarkivetår 2009Pr. TB i arkiv med 2 disk- og 1 tapekopikr. 12.945år 2010kr. 7.389år 2011kr. 5.121år 2012kr. 3.619
Estimatet for størrelsen af Netarkivet er 823 Terabyte (TB) i 2012. Statsbibliotekets samlede løsning(som ud over Netarkivet består af flere andre digitale samlinger med radio/tv som en dominerende del)når op på 2.624 TB til en omkostning på kr. 1.863 pr. TB i 2012. Denne løsning er imidlertid udeninstitutionel redundans, og det vurderes derfor, at det er mest hensigtsmæssigt at anvendeNetarkivets tal som vejledende for omkostninger ved et egentlig fællesarkiv. Det skal bemærkes, atNetarkivets tal bygger på et økonomisk worst case-scenarie, idet prognoserne for omkostningen tillagringen af TB er meget usikre.Omkostningerne i både Det Kongelige Biblioteks og Statsbibliotekets løsning inkluderer nyanskaffelseaf lager i det femte år efter den oprindelige anskaffelse og inkluderer udgifter til køling, strøm ogdriftspersonale. Til sammenligning anslog Gartner Group i sin simulering en udgift på 1.910 kr. pr. TBved en central løsning18. Gartner Groups tal var uden bemanding og uden indregning af teknologiskfornyelse. Ved en forøgelse af kapaciteten til Gartnerrapportens ca. 5.000 TB (i 2012) vil der væreyderligere stordriftsfordel, og den anførte pris pr. TB må anses for worst case-eksempel, som vil kunnegøres billigere pr. TB, hvis alle deltager i løsningen.Både Statsbibliotekets beregninger og Gartner groups beregninger peger således på et tal på ca. 2.000kr. pr. TB som et minimumstal ved fuld størrelse af arkivet på ca. 5.000 TB. I opbygningsfasenanbefales det dog at anvende tabellens tal som vejledende.Tabellen for omkostningerne ved netarkivet medfører altså et estimat på ca. 3.600 kr. pr. TB ved 823TB i 2012. Dette sammenholdes med den noget mere nødtørftige løsning på Statsbiblioteket på 1.863kr. pr. TB ved 2.624 TB i 2012 og Gartner Groups estimat på 1.910 kr. pr. TB ved 5000 TB i 2012.
3.6.3 Lagring og håndtering – objektniveauetHåndteringen af objekter vil i meget høj grad afhænge af disses form og kompleksitet. Håndteringen afdigitaliseret film, som er meget store filer, er fundamentalt anderledes end håndteringen afeksempelvis websider, som består af mange små linkede objekter. Der er derfor forskellige systemer tilbeskrivelse, formidling og bevaring af disse objekter.Det kan etableres et fælles lagersystem for de digitale objekter. Et sådant system kaldes ofte for etDigital Object Management System eller kort et DOMS. Et DOMS kan være distribueret, således atdet består af et netværk af servere, der f.eks. håndterer forskellige filtyper i den samledeinfrastruktur. Et DOMS er designet til at understøtte en række processer, herunder aktiviteter iforbindelse med bevaring af objekter og de nødvendige ændringer, som gennemføres på objekter.Eksempler på sådanne operationer er, at man kopierer objektet fra et disksystem til et andet, eller at18
Gartner Group: Finansielle analyser i forbindelse med digitalisering af kulturarven, 10. maj 2007, side 28.
Rapportens specifikke angivelse er 5,6 petabyte til 1,91 kr. pr. gigabyte pr. år
57
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
man opdaterer formen, eksempelvis fra en gammel Word-version til en nyere eller fra et gammeltfilmformat til et nyere.Et DOMS kan også varetage håndtering af rettigheder, således at materiale kun udleveres i henholdtil gældende aftaler. Endelig kan systemet styre, hvordan de forskellige objekter vises.Det er vigtig at planlægge, hvordan materialer indlemmes i systemet, og specielt, hvordan manautomatisk kan generere metadata som en integreret del af processen. Det har ikke nødvendigvisnoget med selve systemet at gøre. I tilknytning til DOMS kan der etableres et workflowsystem, somtillader systemet at håndtere i praksis alle typer digitale objekter med tilhørende metadatastrukturer,og som understøtter digitaliseringsarbejdsgange med metadatatilføjelser.De forskellige institutioner har forskellige tilgange til, hvordan objekter skal beskrives og håndteres. Imodsætning til den ovenfor beskrevne løsning for bitarkivet er det mindre oplagt, at der kan skabes enfælles løsning på dette område.Inden for bibliotekssektoren har de to store biblioteker valgt at prioritere forskelligt – en prioriteringsom i høj grad afspejler de to institutioners fokus på forskellige opgaver på nuværende tidspunkt. Derer imidlertid påbegyndt en dialog, som kan føre frem til et fælles system. De to forskellige tiltag harsåledes fokus på forskellige relevante aspekter og kan dermed måske forenes: Statsbiblioteket fokuserpå en dynamisk beskrivelse og etablering af workflowsystem som ovenfor beskrevet, og Det KongeligeBibliotek har fokus på bevaringsaspektet.Et DOMS kan med andre ord anvendes til at håndtere en samling bestående af digitale objekter ogfungere som både lager og administrativt værktøj til at styre eksempelvis rettigheder til objekterne.Det kan endvidere fungere som grundlag for en tilgængeliggørelse over for brugerne.
3.6.4 Arkitektur for tilgængeliggørelseTilgængeliggørelsen af materialet kan foregå på mange måder. De oplagte er et system baseret på ensøgeadgang (som Google) eller systemer, som baserer sig på geografiske interfaces. Førstnævntesystem baserer sig i dag på de strukturerede og ustrukturerede ord, som findes i DOMS’er, det andetvil kræve, at materialet tilføjes metadata om lokalitet (geokodes).Det er vigtigt, at materialet kan eksponeres så bredt som muligt, herunder Europeana (somunderstøtter begge tilgange), Google og andre søgemaskiner.Gennem anvendelse af DOMS’er kan der tilbydes en snitflade mod de digitale objekter, som betyder, atdisse kan synliggøres gennem andre produkter og Portaler som Google og Europeana (jf. ovenfor omudveksling af metadata).De to store biblioteker arbejder begge på at etablere effektive søgesystemer af ”integrated search”-typen (Primo og Summa)19.En løsning baseret på DOMS i kombination med et sådant søgesystem vil kunne tilbyde en effektivtilgængeliggørelse af indhold af objektsamlinger. Anvendeligheden vil selvfølgelig afhænge af kvalitet19
Se Midtvejsrapporten side 67-72.
58
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
og mængde af metadata. Statsbiblioteket har allerede etableret en Summa-løsning, som fungerer isammenhæng med DOMS. Omkostningerne til tilføjelse af yderligere digitale samlinger til denneinfrastruktur afhænger af omfang og struktur af de metadata, der forefindes for de enkelte samlinger.Et særligt aspekt i tilgængeliggørelse er adgangsstyringen.Der kan være materiale, hvor adgangen ogbenyttelsen er begrænset til en nærmere defineret kreds af brugere. For dette materiale findes der iprincippet to forskellige løsninger, som begge vil skulle understøttes.Den ene er, at rettighedshaverne til materialet indgår som aktiv part i tilgængeliggørelsen ogetablerer separat adgangsstyring og afregningssystem. Eksempler på dette er Statsbibliotekets aftalemed musikindustrien i Netmusik.dk og en lignende aftale om tilgængeliggørelse af aviser med enprivat udbyder. I disse tilfælde er der ingen statslige ekstraudgifter til tilgængeliggørelse.Rettighedshaveren vil skulle dække procesudgifterne i tilfælde af, at rettighedshaveren ønsker attrække materiale fra arkivet. Brugeren vil skulle betale for servicen.Det andet eksempel er brug af aftalelicenser eller lignende til at sikre, at kun bestemte brugere haradgang til materialet. Eller tilfælde hvor lovningen tilsiger at bestemte brugergrupper har adgang tilmaterialet (som f.eks. medieforskere til radio/tv-arkivet).I sidstnævnte tilfælde vil det være naturligt at etablere et adgangsstyringssystem som del afinfrastrukturen. Et godt bud på et sådant, der dækker store dele af den relevante brugergruppe, errepræsenteret i WAYF-samarbejdet mellem 3 ministerier. Statsbiblioteket har senest anvendt denneløsning til at tilgængeliggøre 30.000 digitaliserede reklamefilm for forskning og uddannelse iDanmark. Ud over selve WAYF-strukturen krævedes i dette tilfælde, at der i forbindelse med hvertudtræk bliver indlagt vandmærke i objektet med brugerens identitet til beskyttelse af misbrug.I forbindelse med digitaliseringen vil det for noget materiale være relevant at undersøgeperspektiverne i at anvende licenstyper som Creative Commons. Denne licenstype kan f.eks. oplyseom, at det digitaliserede materiale gøres tilgængeligt på ikke-kommercielle vilkår, og at det kananvendes på bestemte betingelser. Sådanne standardiserede beskrivelser af vilkårene for benyttelse afmaterialer kan omsættes til maskinlæsbare licenser og dermed være særlig relevante i en distribueretinfrastruktur. Hvis et digitaliseret objekt eksempelvis optræder i en helt ny formidlingssammenhæng,kan det være hensigtsmæssigt, at vilkårene for benyttelse er beskrevet i metadata.
3.6.5 FormidlingDet øverste niveau i midtvejsrapportens systemarkitektur er formidling. Som tidligere nævntbetragtes mere målrettede formidlingsløsninger, som eksempelvis DR’s Bonanza ogKulturarvsportalen, ikke som en del af infrastrukturen og beskrives derfor ikke næmere.Dog vil en minimal formidling, herunder eksponering mod Google og Europeana, kunne ske direkteoven på infrastrukturen, såfremt der etableres en adgangsstyring og on the fly-levering af digitaleobjekter fra arkivet. I forbindelse med etablering af prototypen af Europeana er der indsamletmetadata fra et begrænset antal bidragydere i Europa med en stor manuel indsats, stort set udennyere automatiske værktøjer som OAI-PMH. I den planlagte operationelle version af Europeanaforventes det, at hvert land etablerer en national aggregator, som står for at samle og klargøre
59
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
metadata til Europeana. Det er oplagt at løse opgaven som national dansk aggregator til Europeana isammenhæng med tilgængeliggørelse af dansk digitaliseret materiale.I det omfang materialet eksponeres på internettet og formidles mere aktivt, er der behov for, atinfrastrukturen kan betjene mange samtidige brugere med eksemplarer af det efterspurgte materiale.Det anslås, at en pulje på tre hurtige servere tilknyttet et centralt bitbevaringsarkiv vil kunne betjenei størrelsesordenen af 100 samtidige brugere. I en sådan løsning vil de digitale objekter blivetilgængeliggjort via on the fly-konvertering til formidlingsversion, således at denne kun optagermidlertidig ekstra lagerplads.Der vil være behov for specialiserede servere for nogle samlingstyper som video og radio.Omkostningerne vil afhænge af den endelige arkitektur, målgruppens størrelse og omfanget afbenyttelsen. En løsning kunne være at anvende en løsning, der ligner den løsning, som DR er ved atudarbejde for at betjene sine brugere på nettet.DR er ved at opgradere det eksisterende streaming setup og analysere flere forskellige løsninger.Løsningen skal kunne håndtere mange samtidig brugere. En af løsningerne er en meget kraftig server,der kan håndtere ca. 10.000 samtidige brugere. Denne kan indeholde 5 TB materiale. Disse vil udgørede mest sete og/eller senest anvendte filer. Efterspørger en bruger en anden fil end dem, der ligger påonlineserveren, hentes den fra et internt lager eller transkodes on the fly som i bitarkivsløsningen fraet ”billige” bagvedliggende diskarkiv. Filer der ikke er efterspurgte, fjernes automatisk fraonlineserveren.Serveren koster ca. 2 mio. kr., og det antages, at DR skal etablere en redundantløsning for at sikrefuld adgang til institutionens onlinesatsninger som dr.dk/tv, Bonanza, netradiokanaler osv. Densamlede omkostning vil være på 4 mio. kr. uden reinvesteringer og driftsomkostninger. Løsningenvurderes at kunne kobles med bitarkivet arkitektur, uden at de nærmere detaljer har været analyseretkonkret. En sådan investering vil efter statslige regler skulle afskrives over en periode, typisk lineærtafskrevet. Hvis investeringen betragtes som en ordinær hardwareinvestering, er afskrivningsperiodentre år med en årlig udgift på ca. 1,3 mio. kr. Såfremt investeringen betragtes som led i etudviklingsprojekt, er der større råderum for at fastlægge afskrivningsperioden, men den kunne f.eks.være fem år. Det ville give en årlig udgift på 800.000 kr. Det er næppe sandsynligt, at de samlinger,der udvælges til digitalisering i hovedrapporten, vil give samme behov for serverkapacitet som hos DR.På den baggrund burde en årlig udgift på ca. 800.000 kr. være tilstrækkeligt til at sikretilgængeliggørelse af video og radio.I praksis vil der skulle allokeres mandskab til support og drift til arkivet ved direkte anvendelse afarkivet til tilgængeliggørelse. Det indebærer, at omkostningerne til tilgængeliggørelse omfatte ca. 1årsværk samt de nævnte servere, der vil andrage en årlig udgift på 750.000 kr. I praksis vil det ogsåvære nødvendigt at gennemføre visse udviklingsopgaver (som f.eks. den nævnte vandmærkning ireklamefilmseksemplet). Omkostninger til udvikling er dog ligesom servere til specialiserettilgængeliggørelse udeladt af estimatet. Omkostningerne til en adgangsstyringsinfrastruktur kanestimeres som Kulturministeriets nuværende bidrag til WAYF, som anslås til 25 % af WAYF-årsbudgettet på 3 mio. kr., dvs. 750.000 kr. pr. år.
60
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
3.6.6 Estimat for minimale udgifter til infrastrukturBeskrivelsen af den fælles infrastruktur anvendes til at fremhæve, at der allerede findes systemer ogkompetencer, som kan bidrage til en fælles infrastruktur for digitaliseret kulturarv. Desuden kanbeskrivelsen anvendes til at estimere omkostningerne ved en fælles infrastruktur. Estimaterne for denfælles infrastruktur er samlet i nedenstående tabel.Årlige omkostninger til elementer iinfrastrukturenPr. TB i arkiv med 2 disk- og 1tapekopiSamlet udgift til adgangsstyringSamlet udgift til medieservereSamlet udgift tiltilgængeliggørelsekr. 750.000kr. 750.000kr. 750.000kr. 750.000kr. 12.945kr. 750.000kr. 800.000kr. 7.389kr. 750.000kr. 800.000kr. 5.121kr. 750.000kr. 800.000kr. 3.619kr. 750.000kr. 800.000år 2009år 2010år 2011år 2012
Som det fremgår af tabellen, arbejdes der med en omkostning pr. TB som i Netarkivet.Enhedsomkostningerne falder kraftigt med tiden især pga. stordriftsfordele. De årlige omkostningervil imidlertid være relativt konstante, fordi mindre mængder i de første år skal håndteres til højereenhedspriser end de større mængder, der senere skal håndteres af infrastrukturen, efterhånden somdigitaliseringen skrider frem.Estimaterne indebærer, at hvis der i 2012 er 2.500 TB i arkivet, vil de årlige driftsudgifter tilinfrastrukturen således være: 2500 TB á 3.619 kr. pr. TB + 800.000 kr. + (2 x 750.000 kr.) = 11.347.500kr. Det bemærkes, at der er tale om årlige omkostninger.Estimatet for de årlige omkostninger til fælles infrastruktur kan specificeres og kvalificeres yderligere,når mere præcise lagerstørrelser for de prioriterede digitaliseringsprojekter foreligger. Derudover erder en række variabler, hvis værdi vil kunne fastlægges nøjere i budgetteringssituationen. Der kansåledes være behov for en nærmere analyse af lønomkostningerne ved tilgængeliggørelse samt løbendeudviklingsomkostninger. Omvendt kan adgangsstyring og dedikerede medieservere vise sig at væremindre relevant eller kunne dækkes af eksisterende løsninger på institutionerne. Desuden kan priserpr. TB blive lavere som konsekvens af den tekniske udvikling. Endelig kan der være dele afinfrastrukturen, der kan dækkes af eksisterende bevillinger.Der er således faktorer, der tilsiger, at estimatet kunne være højere, og andre faktorer, der måskekunne tale for at nedjustere. Der er på baggrund af beskrivelserne af scenarierne for digitaliseringenighed i arbejdsgruppen om at tage udgangspunkt i en lagerstørrelse på 2500 TB, svarende ca. tilscenarie 2. Et fuldt udfoldet scenarie 2 vil således indebære udgifter på ca. 10 mio. kr. årligt, mens etfuldt udfoldet scenarie 3 vil indebære noget højere årlige udgifter.
61
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
4 SammenfatningEn vigtig målsætning for gruppens arbejde har været at beskrive en infrastruktur, der kan understøttetværgående formidling af kulturarven. Infrastrukturen omfatter ikke en portal som indgang tilkulturarven. Den foreslåede infrastruktur vil omfatte en søgeadgang til det samlede digitaliseredemateriale og andre interfaces til andre dele af materialerne (f.eks. et Danmarkskort til at fremfinderelevant materiale). Den vil ligeledes understøtte mange andre formidlingsinitiativer, som dog ikkeudgør en del af den grundlæggende infrastruktur.Infrastrukturen vil understøtte præsentation af metadata i mange formidlingssammenhænge. Det kanfinde sted ved at metadata høstes, at de stilles til rådighed gennem webservicer eller gennem direktesøgning i metadata. I de tilfælde, hvor metadata beskriver et digitalt objekt, vil der være et stabilt linktil selve objektet. Det giver mulighed for at præsentere den digitaliserede kulturarv i eksisterendeformidlingssammenhænge f.eks. inden for uddannelsessektorenSom beskrevet i kapitel 2 er digitaliseringsprocesserne for de forskellige materialetyper temmeligkomplicerede. Der findes imidlertid allerede kompetencer og samarbejdsstrukturer, der kan håndtereudfordringerne for de forskellige materialetyper. Nogle af de større institutioner fungerer allerede somkompetencecentre, men der kan være grund til at formalisere og udbygge denne rolle med nogle af defunktioner, der er beskrevet i afsnit 2.2. Der vil under alle omstændigheder være behov for et tætteresamarbejde mellem institutionerne både for at koordinere formidlingen af den digitaliserede kulturarvog anvendelsen af de standarder, som er forudsætningen for en tværgående formidling.Som beskrevet i afsnittet om metadata kan disse fremskaffes fra flere kilder:Metadata fra andre registre: bibliotekernes kataloger samt museers og arkivers registreAutomatisk dannede metadata: informationer trukket ud de digitaliserede filer eller afkonteksten ved høstningManuel registrering i forbindelse med digitaliseringenBrugerskabte data: supplerende data fra brugere.
Udgangspunktet vil i alle tilfælde være anvendelse af eksisterende strukturerede metadata fraeksisterende registre og et krav om at anvende det fælles ABM-format eventuelt som en comply orexplain-strategi. Derudover bør man naturligvis udnytte andre kilder til metadata under skyldighensyntagen til omkostningerne. En række af de ønsker, der måtte være til metadata som led i enbestemt anvendelse af formidling, må opfyldes af de institutioner, der ønsker at anvende dendigitaliserede kulturarv.Afhængigt af, hvordan infrastrukturen opbygges, vil der blive stillet krav til de lokale systemer. Sombeskrevet i afsnit 3.5 bør disse systemer kunne anvendes OAI-PMH for at følge Europeana og XMLSitemaps, såfremt metadata skal udstilles for Google. Desuden må institutionen følge udviklingen afOAI-ORE.Som det er fremgået, er der grundlag for at overveje en fælles infrastruktur særligt i relation tilbitbevaring. Det er derimod muligt, at infrastrukturen skal være fælles, men distribueret påobjektniveauet. Som det fremgår, kan der imidlertid etableres en infrastruktur for tilgængeliggørelse i
62
DIGITALISERING AF KULTURARVEN– endelig rapport fra Digitaliseringsudvalget
umiddelbar tilknytning til bitarkivet. Såfremt der etableres en mere omfattende indsats fordigitalisering af kulturarven, bør disse forhold analyseres og drøftes nærmere, idet der ikke kun ertale om tekniske overvejelser.På baggrund af en analyse af udgifterne til en minimal infrastruktur baseret på et fælles lagerestimeres de samlede udgifter til 10,5 mio. kr. baseret på en lagerstørrelse på 2500 TB. Som beskrevetovenfor kan yderligere information for en række nøglevariabler både øge og sænke estimatet. Det erarbejdsgruppens opfattelse, at man med en årlig investering på 10,5 mio. kr. vil kunne etablere eninfrastruktur, der både kan bevare og lagre den digitaliserede kulturarv og understøtte tværgåendeformidling på en sådan måde, at materialet bliver tilgængeligt via institutionerne, i en fælles arkivmed DC-metadata, et geografisk interface og i Europeana og søgemaskiner som Google.
63