Udvalget for Digitalisering og It 2022-23 (2. samling)
DIU Alm.del
Offentligt
Folketingets Udvalg for Digitalisering og IT
Stormgade 2-6
1470 København K
Telefon 72 28 24 00
Sagsnr.
2023-1967
Doknr.
20902
Dato
16-06-2023
Svar på spørgsmål fra Lisbeth Bech-Nielsen (SF) stillet den 22. maj 2023.
Spørgsmål nr. 77:
”Hvad er status på “Fælles Dansk Sprogressource”, som beskrevet i VLAK-regeringens
natio-
nale strategi for kunstig intelligens (2019)?
https://www.regeringen.dk/media/6537/ai-stra-
tegi_web.pdf”.
Svar:
Der er indhentet svar fra Digitaliseringsstyrelsen, som oplyser følgende:
”I
2019 nedsatte Kulturministeriet et sprogteknologisk udvalg, som skulle undersøge status
for dansk sprogteknologi, barrierer, der hæmmede udviklingen, samt give anbefalinger til ind-
satser, som kunne sætte gang i udviklingen af dansk sprogteknologi. Det sprogteknologiske
udvalgs anbefalinger
1
blev skrevet ind i VLAK-regeringens
”Nationale strategi for kunstig intel-
ligens”
2
fra 2019, hvorved det offentlige forpligtede sig til at give dansk sprogteknologi et løft.
Med baggrund i Digitaliseringspagten og Økonomiaftaler for 2020 med kommuner og regio-
ner blev der igangsat et fællesoffentligt samarbejde for dansk sprogteknologi, under navnet
sprogteknologi.dk, og som er finansieret til og med 2026.
Der har været en stor udvikling inden for kunstig intelligens og sprogteknologi den seneste
tid. Et eksempel herpå er ChatGPT
3
og den underliggende sprogmodel, som har vakt stor op-
sigt siden offentliggørelsen i november 2022.
Der er dog en generel tendens til, at sprogteknologi for de mindre sprog som eksempelvis
dansk udvikler sig væsentligt langsommere end for de større sprog og særligt engelsk.
4
Konse-
kvensen ved manglende dansk sprogteknologi er, at man ikke nyder samme anvendelsesmu-
ligheder af ny teknologi på dansk som på de større sprog. I mange tilfælde betyder det, at
man skal bruge sprogteknologi, som er trænet på engelsk til at løse opgaver på dansk. Den
største udfordring for at udvikle sprogteknologi for de mindre sprog, herunder dansk, er, at
der ikke eksisterer sprogressourcer af samme kvalitet og kvantitet, som fx på engelsk. Sprog-
ressourcer er grundlæggende data, som repræsenterer sproget og kulturen, som algoritmer
1
2
https://dsn.dk/wp-content/uploads/2021/01/sprogteknologi-i-verdensklasse.pdf
https://digst.dk/media/19302/national_strategi_for_kunstig_intelligens_final.pdf
3
Andre store sprogmodeller: Wu Dao 2.0., Megatron-Turing NLG, LEAM-1, OPT, Bloom, Luminous,
Swtich Transformer, GlaM, PaLM (tre sidste er Googles)
4
https://european-language-equality.eu/wp-content/uploads/2022/03/ELE___Delive-
rable_D1_9__Language_Report_Danish_.pdf