B 101 Forslag til folketingsbeslutning om at skabe en stor dansk sprogmodel, også kaldet LLM eller large language model.

Af: Lisbeth Bech-Nielsen (SF) og Karina Lorentzen Dehnhardt (SF)

Udvalg: Udvalget for Digitalisering og It

Samling: 2023-24

Status: Bortfaldet

1. behandling den 22-02-2024

Hele debatten
Overblik over alle taler
Ordfører- og ministertaler

Del

Jeg accepterer Folketingets vilkår for deling

1. Folketinget tilbyder brugerne af ft.dk at dele tv-produktioner produceret af Folketinget.

2. Tv-produktioner fra Folketinget må anvendes uden at blive ændret eller bearbejdet. Endvidere må der ikke bygges videre på Folketingets tv-produktioner. Ophavsmanden (eks. politikere og øvrige talere) har eneret til at udgive samlinger af sine egne indlæg jf. den danske ophavsretslovs § 26

Du kan se alle vilkår her

3. Folketinget tilbyder brugerne at dele Folketingets tv-produktioner via embed-kode, der kopieres fra hjemmesiden.

4. Det er ikke tilladt at ændre i den kopierede embed-kode.

Luk redigering

Start her

Slut her

Varighed 00:26:13

Redigere Klip Godkend

Godkend

Del på Twitter

Del på Facebook

Kopiér link

Kopiér embed

Send til en ven

james

Afbryd Send

Se video af alle taler

Det næste punkt på dagsordenen er:

16) 1. behandling af beslutningsforslag nr. B 101:

Forslag til folketingsbeslutning om at skabe en stor dansk sprogmodel, også kaldet LLM eller large language model.

Af Lisbeth Bech-Nielsen (SF) og Karina Lorentzen Dehnhardt (SF).

(Fremsættelse 19.12.2023).

Vi starter med, at ordføreren for forslagsstillerne, fru Lisbeth Bech-Nielsen, giver en kort begrundelse for forslaget. Velkommen.

Tak. For 15 måneder siden bragede ChatGPT gennem lydmuren, og det gik op for de fleste, hvad kunstig intelligens nu kan, selv for Karsten Hønge. Teknologi handler jo ikke bare om teknologi, men teknologi handler også om ejerskab, og det handler om normer, værdier og etik, og derfor er det også afgørende, at de forskellige AI-teknologier såsom generativ AI, som er det, der er bag ChatGPT, også afspejler og dermed reproducerer dansk kultur, sprog og historie. Og dertil har vi jo også i Europa stramme og gode regler omkring databeskyttelse, copyright, beskyttelse af forskere, forfattere og kunstneres værker, og derfor kan vi jo ikke nøjes med amerikanske techgiganter, som ikke overholder GDPR.

Som det er i dag, kan en gymnasieelev, som gerne vil prøve kræfter med ChatGPT, ikke få det stillet til rådighed af sin uddannelsesinstitution. For man må naturligvis ikke bryde loven, og derfor skal eleven blive privat bruger for at kunne blive undervist i det her, der jo allerede er en teknologi fra i dag, og som også bliver det for fremtiden. Det samme er med en kommunal medarbejder, som heller ikke må bruge de her teknologier, fordi de ikke overholder europæisk og dansk lovgivning. Derfor laver man de her krumspring, og lige om lidt er det alle steder, og så bliver vi nødt til at stå i det valg, som man også gør det lige nu med Chromebooksagen og danske skoleelever, altså om man skal bryde loven for at have adgang til nogle amerikanske platforme og teknologier, som er rigtig, rigtig, rigtig smarte, men som ikke overholder dansk lovgivning, eller om vi skal sikre dansk kritisk infrastruktur og gå vores egen vej. Det er det, forslaget handler om.

Således beriget åbner vi forhandlingen. Den første, der får ordet, er digitaliseringsministeren.

Tak til SF for at rette fokus på et vigtigt emne som kunstig intelligens og store sprogmodellers voksende betydning i vores samfund. Regeringen deler mange af de bagvedliggende tanker og hensyn i beslutningsforslaget. Der er ingen tvivl om, at store sprogmodeller rummer store positive potentialer og vi skal udnytte de potentialer til at løse nogle af vores store samfundsudfordringer på en ansvarlig måde.

Beslutningsforslagets kerne er, at der her og nu skal sættes gang i udviklingen af en stor dansk generativ sprogmodel – en model med dansk indhold, der kender traditionerne ved en dansk juleaften i stedet for en amerikansk thanksgiving, en model med offentligt ejerskab i Danmark og demokratisk kontrol med teknologien.

Er det den vej, vi skal gå som samfund nu? Oprigtigt talt har jeg selv været i tvivl, for potentialerne er tillokkende. Men der er også en række vilkår, vi må forholde os til. For det første eksisterer markedet for store sprogmodeller, og nye sprogmodeller kommer hele tiden til – ikke en eller to, men mange. Eksisterende sprogmodeller bliver konstant forbedret; området udvikler sig i meget hastigt tempo. Det er ikke umiddelbart realistisk, at Danmark alene kan følge med markedsudviklingen. Forslagsstillerne henviser til ChatGPT 3 udviklet i 2020. Den er allerede forældet og overhalet af langt mere kraftfulde modeller. Jeg kan her og nu ikke se en farbar vej for, hvordan vi kan udvikle en model, der ved lanceringen er bedre end det, markedet på det tidspunkt kan tilbyde. For hvis vi ikke kan udvikle en model, der er bedre, vil den så bliver brugt tilstrækkeligt? Jeg tvivler.

For det andet viser de økonomiske indikationer, som vi kender til, at udviklingen af en stor generativ sprogmodel kan blive endog meget omkostningstung. Både udviklingen og driften og vedligeholdelsen er ressourcekrævende. Der kan selvfølgelig skrues ned for ambitionsniveauet – der kan bygges mindre modeller – og forventningerne til dens anvendelse kan sænkes. Men jeg mener ikke, at vi for nuværende har tilstrækkeligt grundlag til at beslutte at bruge et større millionbeløb af skatteborgernes penge.

I beslutningsforslaget beskrives det, at udviklingen af en dansk sprogmodel basalt set handler om at redde det danske sprog og den danske kultur. Som jeg ser det, handler det i høj grad også om at udvikle et it-system – i det her tilfælde et stort relativt kompliceret it-system. Det her område er åbenlyst vigtigt, men også nyt og kompliceret. Derfor er det vigtigt, at vi går klogt til værks, at vi tænker os om, inden vi sætter i gang. Men jeg vil gerne understrege, at vi på ingen måde sidder på hænderne. Vi skal som samfund være langt bedre til at bruge kunstig intelligens, og derfor skal vi også engagere os på mange forskellige fronter.

For det første er jeg enig i, at vi skal træde aktivt ind på området og understøtte vores sprog og kultur. Det skal vi gøre ved at tilgængeliggøre flere danske sprogressourcer. Vores sprogressourcer skal understøtte, at sprogmodeller, vi kommunikerer med og bruger i dagligdagen, bliver bedre til at forstå vores sprog, værdier og kultur. Vores sprogressourcer skal understøtte, at udviklere og leverandører har mulighed for at inkorporere danske data til bedre sprogforståelse og tekstanalyse.

Og vi er godt i gang. Vi har sammen med KL og Danske Regioner udviklet den digitale platform sprogteknologi.dk, som skal give let adgang til danske sprogressourcer. Det arbejde skal vi fortsætte og intensivere. Vi skal nemlig anse vores data som en strategisk ressource, der skal anvendes til at skabe et bedre digitalt samfund. I mine øjne er det vores data snarere end en stor sprogmodel i sig selv, som er den fælles infrastruktur, og her har vi åbenlyst en offentlig opgave. Derfor vil regeringen drøfte investeringer i tilgængeliggørelse af danske sprogressourcer, som kan anvendes til træning af sprogmodeller, med aftalepartierne bag »Danmarks digitaliseringsstrategi«.

For det andet skal vi sikre ansvarlig brug. Digitaliseringsstyrelsen har allerede udarbejdet en vejledning til både myndigheder og virksomheder om ansvarlig brug af generativ kunstig intelligens. Jeg vil heller ikke udelukke, at der kan blive behov for lovgivning. Udviklingen inden for sprogmodeller går stærkt, og anvendelsesmulighederne er mange både for myndigheder og virksomheder, og derfor skal vi understøtte, at organisationer på tværs af samfundet kan navigere i, hvordan man sikrer, at teknologien og værktøjerne bidrager til at skabe værdi, og undgår faldgruber. Vi skal på tværs af myndigheder afklare behovene og afklare, hvilke modeller der bedst og mest ansvarligt kan anvendes til specifikke sektorer inden for vores nuværende regulatoriske rammer.

For det tredje skal vi engagere os i europæisk og internationalt samarbejde på området, meget gerne med vores skandinaviske naboer. Vi skal sammen med vores europæiske samarbejdspartnere søge at præge den teknologiske udvikling i forhold til sprogmodeller. Samarbejde med ligesindede lande er en forudsætning for, at lande som Danmark i et globalt perspektiv for alvor kan gøre sig gældende, så vi i fællesskab mindsker afhængigheden af amerikanske techgiganter i forhold til den her banebrydende teknologi.

Min og regeringens linje er klar: Danmark skal have en ambitiøs tilgang til kunstig intelligens, også i forhold til brug af sprogmodeller. Vi skal tage udviklingen alvorligt og udnytte mulighederne ansvarligt, men uden at eksperimentere med skatteborgernes penge på et ufuldstændigt grundlag. Vi skal fokusere på rammerne for, hvordan vi kan bruge sprogmodeller ansvarligt, og vi skal i højere grad end nu undersøge vores sprog, kultur og værdier i eksisterende løsninger. Men vi skal ikke udvikle en dyr sprogmodel, der risikerer at være forældet, når den kan tages i brug. Regeringen prioriterer at afvente erfaringer fra den offentlige sektors ansvarlige brug af eksisterende sprogmodeller, inden vi endegyldigt fastlægger en kurs, og inden vi investerer et større millionbeløb i Danmark eller i samarbejde med andre lande.

På den baggrund kan regeringen ikke tilslutte sig beslutningsforslaget. Det betyder ikke, at vi i Danmark aldrig kommer til at udvikle en stor generativ sprogmodel, men det bliver ikke i indeværende folketingssamling. Tak for ordet.

Der er en kort bemærkning fra fru Lisbeth Bech-Nielsen, SF.

Tak. Ministeren og jeg har jo haft lejlighed til at diskutere det her endog nogle gange, men jeg føler mig alligevel nødsaget til at rette nogle misforståelser, som jeg synes at ministeren bliver ved med at komme med i forhold til det her. For det er jo rigtigt nok, at et af kriterierne er at beskytte dansk sprog og kultur, men noget andet er jo, at det handler lige så meget om at have teknologi, der er lovligt at bruge i Danmark. Og de store sprogmodeller, der findes derude lige nu, er Bard, LaMDA, ChatGPT, og de kommer fra de store techgiganter, som vi kender, nemlig Google, Facebook osv., og de er ikke GDPR-medholdelige; de er ikke lovlige. Så jeg forstår ikke, hvilke erfaringer ministeren vil indhente fra det offentlige Danmarks brug af sprogmodeller, for der er ikke nogen af de store, rigtig gode modeller, som ville være lovlige at bruge i dag.

Så det er mit ene spørgsmål til ministeren: Hvordan skal man indhente nogle erfaringer, som man kun kan få ved at bruge de her modeller ulovligt, og hvor man jo ikke kan putte borgernes sensitive data ind i dem for f.eks. at høste nogle produkter den anden vej?

Ministeren.

Lige nu er der mig bekendt ikke nogen sprogmodeller, der bliver brugt i den offentlige sagsbehandling – endnu. Men meget tyder sådan set på, at vi vil få et økosystem af en masse forskellige sprogmodeller, der vil udvikle sig på markedet. Og de sprogmodeller ville man så forhåbentlig, formentlig, kunne bruge i den offentlige sagsbehandling, hvor man forhåbentlig ville kunne sikre kontrol med dataene og sikre gennemsigtighed. Det er jo også noget af det, vi sikrer med AI-forordningen; vi sikrer gennemsigtighed i forhold til træningsdata. Og selvfølgelig skal borgernes data også beskyttes, i forbindelse med at man bruger de her sprogmodeller. Men jeg har meget svært ved at se, hvorfor det ikke kan være en sprogmodel, der er udviklet på det private marked, som man bruger, snarere end at man fra det offentliges side selv skal udvikle en stor sprogmodel.

Spørgeren.

Det kan jo sagtens være et offentlig-privat partnerskab. Det kan det sagtens. Som vi også har diskuteret på andre tidspunkter, er et af de store tiltag, der er lige nu, det, der hedder Danish Foundation Models – jeg bliver nødt til at sige det på engelsk, for det hedder ikke noget på dansk – og det er jo et samarbejde mellem Alexandra Instituttet og samtlige danske universiteter med professorer i kunstig intelligens i spidsen, som mener, at det her er vejen at gå. Og det er derfor, at det undrer mig, at Digitaliseringsministeriet så nemt fejer det af banen, når alle de her mennesker, som ved allermest om det og arbejder med det, siger: Vi har brug for det, fordi det bliver en del af den kritiske infrastruktur i Danmark.

Ministeren.

Altså, nu er det sådan, at meget få faktisk siger, at der er et behov for, at vi udvikler en stor dansk offentlig sprogmodel. Jeg tror som sagt snarere, at vi vil se, at der på det private marked vil være et økosystem af sprogmodeller, som man så ville kunne bruge i den offentlige sektor. Men igen vil jeg gerne understrege, at det naturligvis er helt essentielt, at man kan beskytte borgernes data, og at man kan sikre, at man bruger de her sprogmodeller på en ansvarlig måde.

Der er ikke ønsker om flere korte bemærkninger, så tak til digitaliseringsministeren. Vi går nu i gang med ordførerrækken, og den første, der får ordet, er hr. Malte Larsen, Socialdemokratiet. Velkommen.

Jeg takker. Socialdemokratiet mener, at Danmark skal have en ambitiøs tilgang til anvendelse og udvikling af kunstig intelligens, og at dette skal ske på en balanceret, etisk og ansvarlig måde. Vi er jo enige med forslagsstillerne, når det kommer til at sætte fokus på generative sprogmodellers betydning i Danmark. Udviklingen inden for spogmodellerne går stærkt, og mulighederne er mange – for både myndigheder og virksomheder.

Beslutningsforslaget går ud på, at der her og nu skal sættes gang i udviklingen af en stor dansk generativ sprogmodel, og det er da tillokkende: en model med offentligt ejerskab og demokratisk kontrol. Men markedet udvikler sig, som også ministeren sagde, utrolig hurtigt. Nye modeller kommer til, og andre forgår. Forventningen om, at Danmark alene kan følge med den udvikling, tror jeg er urealistisk. Dertil kommer de økonomiske konsekvenser og de udgifter, der er forbundet med at skabe en sådan model.

På den baggrund kan Socialdemokratiet ikke tilslutte sig beslutningsforslaget.

Tak til ordføreren. Der er ikke nogen korte bemærkninger, så vi går videre i ordførerrækken til hr. Christoffer Aagaard Melson fra Venstre. Værsgo.

Tak for det. Jeg vil også starte med at takke SF for at sætte fokus på et vigtigt emne, som rummer rigtig mange vigtige spørgsmål og dilemmaer, og som vi skal have fundet nogle veje til hvordan vi får udnyttet potentialerne i på en god måde her i Danmark. Det skal vi i gang med. Derfor er jeg også rigtig glad for, at vi blev enige om, at vi skal sætte 61 mio. kr. af her i digitaliseringsstrategien til, at vi skal kigge nærmere på, hvordan vi kommer i gang med at bruge AI i større omfang, også i den offentlige sektor i Danmark, på en god måde.

Som ministeren og den forrige ordfører er jeg dog heller ikke nået dertil, hvor jeg er overbevist om, at det nødvendigvis skal være i offentligt regi, at vi skal bruge en masse penge på at udvikle en model. Der er rigtig, rigtig store virksomheder med rigtig mange penge, der har fuld fart på udviklingen, både i Europa og i resten af verden i de her år. Jeg tror på, som det ser ud lige nu, at vi får nogle bedre systemer og en bedre brug af vores penge, hvis vi i stedet for selv at udvikle de her produkter stiller krav til de it-systemer, vi bruger og køber i fremtiden, og prøver at gå ned ad det spor. Det er der også andre lande der er gået i gang med. Vi skal også kigge på, hvordan vi sikrer, at de her modeller kan trænes på danske data, hvilket ministeren også redegjorde for at vi er i gang med at kigge på. Jeg tror også, at det beløb, der er nævnt i beslutningsforslaget, er lige vel optimistisk i forhold til at få en model, som er langtidsholdbar og kan bruges. Mig bekendt er det et milliardbeløb, man er oppe på at bruge i Sverige, i forhold til den model, man kigger på derovre. Så derfor er der i sig selv noget usikkerhed omkring økonomien, der gør, at vi ikke synes, at vi kan bakke op om det her beslutningsforslag.

Men med de ord vil jeg igen bare sige, at jeg synes, det er godt, at SF rejser debatten her i Folketinget, for det er på tide, at vi kommer i gang med det i Danmark, og at vi får kigget på det, og at vi får diskuteret dilemmaerne, også omkring regulering. Hvordan forholder vi os til det? Hvordan er det, vi hjælper og sikrer, at både private og offentlige myndigheder kan navigere, så de kan komme med på vognen uden at bryde de regler, der bliver sat op? Hvordan er det, vi tidligt sikrer, når vi implementerer ny lovgivning, også fra EU, at man i især små og mellemstore virksomheder, men også i den offentlige sektor, har nogle klare rammer for, hvad man kan gå i gang med, så man ikke sidder og venter på grund af ubegrundet frygt og egentlig på grund af regulatorisk uklarhed, som vi bl.a. har set rigtig meget, i de første år efter vi implementerede GDPR? Så der er rigtig meget at tage fat i, og derfor synes jeg, det er rigtig godt, vi får startet på den her debat. Men med de ord kan vi ikke støtte beslutningsforslaget.

Tak til ordføreren. Der er en kort bemærkning til fru Lisbeth Bech-Nielsen, Socialistisk Folkeparti. Værsgo.

Tak for talen. Jeg vil bare spørge ordføreren, hvor han tænker at de her store sprogmodeller skal komme fra. Vi skal kunne bruge dem i en kommune med sagsbehandling, der indebærer borgernes sensitive data, eller i forsvaret eller på Rigshospitalet med patienternes sundhedsdata. Hvor tænker ordføreren at den her model eller platform eller store sprogmodel skal komme fra for at kunne overholde dansk lovgivning?

Ordføreren.

Den kan jo komme rigtig mange steder fra, hvis de virksomheder kan godtgøre, at de overholder dansk lovgivning. Altså, der er rigtig mange it-systemer, der i dag bliver brugt i den offentlige sektor, fra dygtige danske private leverandører, som har nogle andre kompetencer til at udvikle it-systemer, end vi har i staten, og som også håndterer vores it i forsvaret, også med et rigtig, rigtig højt sikkerhedsniveau, og jeg tror, de vil være bedre til at håndtere de her opgaver, end vi selv vil være. Jeg synes ikke, vi har ret mange gode eksempler på, at det er gået godt, når staten selv har kastet sig ud i at udvikle et it-program.

Spørgeren for den anden korte bemærkning.

Nej, det her er selvfølgelig ikke staten; det er jo nogle af de klogeste hoveder i Danmark, som arbejder på de universiteter, der gennem et universitetssamarbejde har foreslået det her, og det er også dem, der har vurderet, hvad det vil koste. Det er selvfølgelig ikke noget, jeg bare har fundet på.

En af pointerne med, at det ikke koster mere end de 40 mio. kr., er, at det er, fordi forskerne har adgang til to af de største supercomputere i Europa, LUMI i Finland og Leonardo i Italien, som en privat aktør ellers ville skulle gå ud at købe adgang til. Ligeså har forskere jo også adgang til at træne på data, som det er ulovligt for kommercielle aktører at træne på. Så det er derfor, at den her rapport, ministeren også hele tiden henviser til, er at blande pærer og æbler.

Ordføreren.

Ja, men når det er sagt, er jeg stadig ikke sikker på, at det setup vil kunne matche det, som det private kan levere. Jeg synes stadig også, at det er et meget optimistisk tal, i forhold til hvad man har været i stand til at gøre i andre lande, hvor man er begyndt at kigge på det her. Altså, med hensyn til referencen til de ildsjæle, der grundlagde ChatGPT i 2020, og hvad de selv har oplyst de brugte på det af midler, synes jeg, det er lidt for løst til, at jeg vil lægge hovedet på blokken og sige, at jeg tror, vi kan lave noget lignende i Danmark for det samme beløb.

Tak til ordføreren. Der er ikke flere korte bemærkninger, så vi går videre i ordførerrækken til fru Sólbjørg Jakobsen, Liberal Alliance. Værsgo.

Mange tak. Jeg er vikar for ordføreren, som desværre ikke er til stede, men som har klædt mig godt på, så vi kan debattere det her meget interessante forslag. Vi har faktisk skullet bruge noget tid i Liberal Alliance på at overveje, hvad vi selv mener her, for der er mange ting, der taler for det.

Hvis vi først kigger på, hvad der taler for det, er det, at vi har mulighed for at bevare kontrollen over træningsdata og dermed sikre, at modellen ikke er trænet på ophavsretligt materiale eller data, som indeholder personfølsomme oplysninger. EU og Danmark har strammere regler for databeskyttelse og ophavsret end USA. Det er relevant, eftersom data, når du bruger f.eks. ChatGPT, gemmes på amerikanske servere, og det kan være et problem, når virksomheder, både private og offentlige, benytter sig af det. Det vil også give os en grundliggende indsigt i svagheder, bias og begrænsninger og dermed give os en større gennemsigtighed og tillid til det svar, der kommer fra den. Og desuden vil en statslig sprogmodel kunne bruges af offentlige forvaltninger, hjemmeplejen m.v., hvilket også er blevet nævnt, i deres arbejdsgange. Men dette tilbydes også allerede af private løsninger, f.eks. Microsoft Copilot.

Når vi så kigger på, hvad der taler imod det, er det, at hvis vi kun tager de data, som der ikke er copyright på, som ikke indeholder personfølsomme oplysninger, og som vi mener repræsenterer de normer og værdier, der er i Danmark, og som i øvrigt kommer fra Danmark, er det så nok til at træne en model? Det koster også mange penge både at bygge, videreudvikle og drifte en dansk sprogmodel. Hvis man ikke videreudvikler den løbende, vil den hurtigt blive forældet. Det kræver altså en langsigtet forpligtigelse. I forslaget fra SF vurderer man, at det kun koster omkring 40 mio. kr. at udvikle og etablere en dansk sprogmodel. Regeringen vurderer dog, at det kan koste op til 1,4 mia. kr., afhængigt af løsningen. Vi mener, at pengene kan bruges bedre på noget andet. Forslaget indeholder ingen estimater på, hvad videreudvikling og drift vil koste, og det ser vi også lidt en problematik i. Og hvad der måske var et problem i forbindelse med sprogmodellerne for et halvt år siden, er det måske overhovedet ikke i dag og i hvert fald ikke om et år.

Derfor er det svært at retfærdiggøre at bruge penge på en statslig sprogmodel, altså når markedet allerede er godt i gang med at levere de efterspurgte løsninger. Vi frygter også, at den statsligt udviklede sprogmodel vil ende med at være håbløst forældet, allerede før den er udviklet, og dermed aldrig sådan rigtig kommer i brug, fordi der vil findes bedre alternativer i det private marked, som allerede vil have fået en høj tilslutning. For at være helt ærlig er det svært at forestille sig, at der kommer en statslig løsning, som vil være mere interessant end løsninger fra Apple, Microsoft, OpenAI osv. Sidste gang jeg stiftede bekendtskab med et statsligt it-system, var i mit forrige job som fuldmægtig i Vurderingsstyrelsen, og jeg kan hilse og sige, at det ikke var så billigt, som man forventede.

Derfor når vi frem til den konklusion, at selv om vi forstår hensigten bag SF's beslutningsforslag, kan vi ikke støtte det. I Liberal Alliance tror vi på, at markedet vil være i stand til at løfte opgaven både bedre og hurtigere og mere sikkert, end staten kan. Tak for ordet.

Tak til ordføreren. Der er en kort bemærkning til fru Lisbeth Bech-Nielsen, Socialistisk Folkeparti. Værsgo.

Tak, og tak for et meget seriøst, synes jeg, indlæg. Det er klart, at sådan en offentligt tilgængelig open source-model skal kunne bruges lokalt. Det vil sige, at den selvfølgelig skal trænes videre på Rigshospitalet eller i forsvaret eller i kommunen, og det er rigtigt, at der vil de selvfølgelig skulle afholde udgifterne. De er ikke regnet med her. Det er helt klart, ligesom almindelig drift jo ikke er noget, vi normalt kigger på her. Så kan man jo tilvælge modellen eller lade være; det her er alene for at udvikle den. Det er måske endda faktisk lidt højt sat, altså prisen for det, og det er også derfor, at den her rapport, der hele tiden bliver henvist til, er så håbløst pessimistisk i forhold til priser på GPU og on premise og alle de her ting, som de siger er meget, meget dyrt.

Det, jeg synes er det grundlæggende spørgsmål her, er, om man synes, at det er vigtigt, at vi inden for det offentlige Danmark har noget, der lynhurtigt bliver kritisk infrastruktur, og som vi kan bruge lovligt. Det handler jo ikke om, hvad du eller jeg i vores private funktioner synes er sjovt at lege med eller lave noget med, f.eks. ChatGPT.

Ordføreren.

Det var sådan lidt svært at høre spørgsmålet, men jeg tror, spørgeren kommer lidt ind på, at der reelt set skal være nogle produkter og nogle rammer, som man kan bruge forsvarligt og lovligt og ikke som privatperson. Nu er det jo også præcis det, jeg taler om. Alle os, der sidder her i salen, har jo et Microsoft Office-produkt på vores computer. Det er jo noget, vi sagtens kan bruge og har fået at vide kan bruges sikkert og godt.

På samme måde tror jeg også, at det private kan udvikle løsninger, som vi vil kunne bruge i det offentlige, og som vi ser i rigtig mange andre sammenhænge, altså at det ikke behøver at være staten, der står for det. Derfor er det jo, at jeg egentlig godt kan forstå, at Liberal Alliance står lidt modsat SF i den her sag, altså fordi vi har nogle grundlæggende forskelligheder, i forhold til hvor vi helst ser tingene udvikle sig hen. Der er vi i Liberal Alliance tilhængere af, at det er markedet, der er det skabende.

Spørgeren for den anden korte bemærkning. Værsgo.

Jeg ville synes, det var fantastisk, hvis der var en privat virksomhed, der, selvfølgelig til den rette pris og under de rette forudsætninger, ville udvikle sådan en model, som det offentlige Danmark vil kunne bruge lovligt osv., men det gør de ikke. Jeg har ikke tid til nu at komme ind på hvorfor; det vil jeg gøre i min tale, men det gør de ikke. Derfor vil jeg sige, at det kæmpe arbejde, der allerede foregår på universiteterne, synes jeg netop kunne være et afsæt for det. Men tak for overvejelserne.

Så er det hr. Stinus Lindgreen, Radikale Venstre. Værsgo.

Tak for det. Jeg blev bare inspireret af ordførerens tale. Jeg håber, at den normale ordfører har klædt ordføreren på talerstolen på. Jeg er sådan set enig i, at det ikke nødvendigvis er noget, som vi skal udvikle i det offentlige. Men noget, vi jo kunne gøre herinde fra, var at sørge for, at den data, som findes derude, og som vi har håndsret over, kan man sige, stilles til rådighed af os til brug for dem, der har brug for og lyst til at udvikle de her modeller. Er det noget, som Liberal Alliance kan se at vi faktisk kunne bruge penge på, altså sørge for, at alle de datakilder, som vi jo bestemmer over herindefra, bliver stillet mere eller mindre frit?

Ordføreren.

Det er ikke noget, vi konkret har taget stilling til, så det vil jeg ikke kunne give et meget konkret svar på. Men jeg ved, at bare sådan noget som det her forslag er noget, Liberal Alliance har taget meget seriøst og kigget grundigt på, fordi vi kigger ind i en digital fremtid, hvor der skal ses på nogle nye løsninger. Jeg synes, at jeg kan se, at alle her rundtomkring i salen er åbne for at få kigget på, hvordan vi fornuftigst kommer fremad med det, og især hvis det er, at vi sidder på noget, der virkelig kan bidrage til en fremgang og til nogle gode løsninger her i Danmark. Så det kan jeg ikke afvise overhovedet, men vi har ikke drøftet det, nej.

Tak til ordføreren. Der er ikke flere korte bemærkninger, så vi går videre i ordførerrækken til hr. Jeppe Søe fra Moderaterne.

Tak for det, formand. Jeg kunne egentlig gøre det meget kort. Jeg er hundrede procent enig med Liberal Alliance. Jeg er også hundrede procent enig med ministeren, der i det her tilfælde virkelig er min minister. Det er ikke kun, fordi vi er i regering sammen, men fordi jeg er enig.

Det her er dyrt. Det er en dyr økonomi, der skal på spil. Jeg mener slet ikke, det er statens rolle. Jeg mener, der er private, der gør det her bedre. Og så er der det helt store, nemlig at så snart vi går i gang, og også går i gang her i salen, så er vi på det nærmeste altid bagud.

Jeg tror på det, hr. Stinus Lindgreen sagde lige før, med at stille datakilder til rådighed. Der skal vi gøre en kæmpe indsats, men vi vil altid være bagud med den teknologi, som vi laver i staten, og et meget godt eksempel på det er i virkeligheden det her beslutningsforslag, og det vil jeg så i stedet for at bruge min tid på. Der står nemlig i bemærkningerne til beslutningsforslaget:

»Hvis man f.eks. spørger chatbotten, om man må stille en barnevogn foran en café, vil den på det kraftigste fraråde dig det og pointere, at du desuden kan blive straffet for det. Den kender ikke til de uskrevne danske regler eller dansk lovgivning.«

Det er netop en af tankerne i det her, altså at de svar, man får, ikke er danske værdier, og at man vil få helt forkerte svar. Jeg turde så godt stille det samme spørgsmål til netop ChatGPT, som ikke er 3'eren, men nu 4'eren, og svaret er faktisk meget fint:

I Danmark og mange andre lande er det almindeligt og generelt acceptabelt at stille en barnevogn foran en café, især når forældrene sidder indenfor eller tæt ved og kan holde øje med den. Der er dog vigtige overvejelser. Punkt 1 er sikkerhed. Det er vigtigt at stille barnevognen, så den ikke blokerer fortovet eller indgange og nødudgange. Den skal placeres på en måde, så den ikke udgør en sikkerhedssko for andre. Punkt 2: Nogle caféer eller restauranter kan have specifikke regler eller politikker vedrørende barnevogne. Det er altid en god idé at tjekke med personalet, hvis du er usikker. Punkt 3 er hensynet til andre. Det er vigtigt at tage hensyn til andre gæster og fodgængere, og barnevognen bør ikke optage unødig plads og forstyrre andre. Punkt 4 er vejrforhold. I dårligt vejr såsom regn eller stærk sol bør forældrene overveje barnets komfort og sikkerhed, når de beslutter, hvor barnevognen skal placeres. Punkt 5 er tilsyn. Selv om barnevognen er i nærheden, er det vigtigt at forældrene holder regelmæssigt øje med den og med barnet. I praksis varierer håndteringen af denne situation meget. Det er ofte op til forældrenes dømmekraft og de specifikke omstændigheder.

Det mener jeg egentlig er en meget god beskrivelse af, hvor man stiller sin barnevogn i Danmark, og det er et meget godt eksempel på, hvor hurtigt det går: Fra det sekund I satte jer og skrev det her, er der faktisk sket rigtig meget siden. Så stærkt går det.

Men jeg vil godt sige tak for, at I tager det op. Jeg vil især sige tak for det, fru Lisbeth Bech-Nielsen lige har givet mig, nemlig nogle notater, som går endnu dybere ned i, hvad det er, I gerne vil. Jeg læser det med glæde om et lille øjeblik og går lidt dybere ned i jeres tanker. Men vores tanke er, at det her kan private skabe, og at staten i hvert fald ikke skal ind over det.

Tak til ordføreren. Der er ikke nogen korte bemærkninger, så vi går videre i ordførerrækken til fru Betina Kastbjerg, Danmarksdemokraterne. Værsgo.

Tak for ordet, og tak til SF for at fremsætte forslaget. Vi har jo lige haft forhandlinger om en digital strategi i Danmark, hvor netop det med at udvikle en dansk sprogmodel også var et af ønskerne. Det kom vi ikke helt i mål med at få med i aftalen, så derfor synes jeg, det er rigtig fint, at SF kommer med det her beslutningsforslag. Vores nordiske nabolande, både Sverige og Norge, er allerede i gang med at udvikle sprogmodeller frem for kun at være afhængige af de her udenlandske kommercielle interesser, og nu, når hr. Jeppe Søe har spurgt ChatGPT, kan jeg også indrømme, at det har jeg også gjort. Jeg spurgte den så ikke om det med barnevogne, men jeg spurgte den om, hvad den kunne sige om en dansk sprogmodel, og hvad fordelene ville være. Det ville f.eks. være bedre forståelse af det danske sprog. Det var noget med kulturel relevans, og det var noget med, at det var mere effektivt, og at den bedre ville kunne forstå det danske sprog, den danske kontekst og de danske nuancer i det danske sprog. Man kunne opleve en forbedret brugeroplevelse, og at brugere, der kommunikerer på dansk, sandsynligvis også ville få et bedre og også relevant naturligt svar. Det var også noget med at fremme dansk sprogteknologi, så kunne der være noget lokal integration og brug i virksomhederne, som de kunne drage fordel af til deres produkter, og så var der så også det omkring datasikkerhed og overholdelse af regler. Så jeg synes jo, den kom med ret gode argumenter for hvorfor.

Så ved vi også godt, at det jo ikke er en ny ChatGPT, men derimod en formålsspecifik model, der er tale om. Den kan bruges inden for offentlig forvaltning, sundhedsvæsenet, uddannelse, forskning osv., altså inden for de sektorer. Derudover ønsker vi også i Danmarksdemokraterne at værne om det danske sprog, de danske værdier og vores kultur, så vi er enige med forslagsstillerne, og derfor støtter Danmarksdemokraterne forslaget.

Tak. Der er ingen kommentarer. Næste taler på talerstolen er fru Mona Juul fra Det Konservative Folkeparti.

Tak for ordet, og tak til forslagsstillerne. Vi skal have en dansk sprogmodel. Det mener jeg simpelt hen ikke der kan være nogen som helst form for tvivl om. Sverige og Norge er allerede i gang, og vi skal som et lille sprog og en lille kultur selvfølgelig have alternativer til de modeller, der p.t. kommer flyvende. Vi skal være uafhængige, vi skal have bedre kontrol over vores data, og så skal modellen i modsætning til de amerikanske selvfølgelig følge EU-standarder for privatliv og sikkerhed. Udviklingen er allerede i gang. Der arbejdes på sagen, og f.eks. har Aarhus Universitet taget initiativ til at oprette et nyt center for kunstigt intelligente sprogmodeller. Vi har også netop lavet en politisk aftale om en strategisk indsats for kunstig intelligens, hvor vi bl.a. skriver, og her citerer jeg:

»Aftalepartierne drøfter udmøntningen af rammen hertil i 2024, herunder eventuelle investeringer i tilgængeliggørelsen« – det er virkelig nogle trælse ord, vi nogle gange beslutter os for, hvad? – »af danske sprogressourcer, som kan anvendes til træning af sprogmodeller, og en eventuel dansk sprogmodel«.

Første skridt er at frigive flere data. En dansk sprogmodel kræver danske data, data af høj kvalitet med stor troværdighed, og jeg har for ikke ret lang tid siden stået på samme talerstol og nævnt det her emne. Jeg nævnte også, at DR har masser af egenproduceret kvalitetsindhold, som allerede er betalt med skattekroner. Hvorfor ikke lade robotter læse og lære med? Jeg nævnte også, at vi kunne lade os inspirere af Statens Museum for Kunst, som digitaliserer værker, stiller dem til rådighed for hele internettet og lader andre bruge løs og udstille på andre platforme. Vi kunne have samme tilgang her i Folketinget. På Folketingets hjemmeside ligger mange timers transskriberede debatter, som vil være en god kilde til sammenhængen mellem skriftsprog og det talte sprog, endda ovenikøbet også på jysk og andre dialekter, ikke sandt? Skulle vi ikke starte med de tre platforme, altså DR, Statens Museum for Kunst og Folketinget? Så er vi ligesom endelig i gang.

Uanset hvad vil de data jo også gøre de udenlandske modeller langt bedre, ligesom de allerede bliver nu. Jeg kan derfor på ingen måde genkende forslagsstillernes eksempel med parkering af barnevogne foran en café. Det må jeg simpelt hen give nogle af de andre ordførere fuldstændig ret i. Der kommer altså ikke amerikaniserede svar, og eksemplet er egentlig ret misvisende. Jeg bliver dog også særlig bekymret, når forslagsstillerne lægger op til en offentlig løsning; det må jeg sige. Jeg mener slet ikke, at det skal være staten, der skal udvikle eller eje en model, faktisk slet ikke. Det synes jeg vi har set alt for mange dårlige eksempler på, og ærlig talt kan vi ikke vente på en mere eller mindre offentligt udviklet løsning, der ovenikøbet virker. Det tror jeg ikke på.

Den holdning er jeg ikke alene om at have. Janus Sandsgaard fra TEKNIQ Arbejdsgiverne har f.eks. sat en debat i gang på LinkedIn om lige præcis det her emne. Her bemærker jeg bl.a. et svar fra en Kasper Junge, der, når jeg tjekker hans cv, ser toprelevant ud i forhold til det her, synes jeg. Han svarer helt kort: Nej, staten skal ikke skabe en dansk sprogmodel. Han fortsætter med tre gode råd: 1) Vi skal snakke med alle dem, som i forvejen skubber udviklingen af åbne danske sprogmodeller frem, 2) vi skal høre dem, hvad de har brug for, og 3) vi skal finde en måde at give dem det, de har brug for. Jeg synes faktisk, det lyder rigtig fornuftigt; det må jeg sige.

Så politisk er vi helt enige med forslagsstillerne i, at vi skal sætte rammerne og frigive data. Ejerskab og udvikling ser vi ikke helt ens på. Måske skal vi blive mere enige i udvalgsarbejdet. Det er jeg villig til at se på; det er der ikke nogen tvivl om. Tak for det.

Der er ingen korte bemærkninger. Tak til ordføreren. Jeg ser ikke nogen ordfører fra Enhedslisten, så den næste ordfører er hr. Stinus Lindgreen fra Radikale Venstre.

Tak. Jeg beklager. Jeg forventede egentlig, at Enhedslisten var her, så jeg blev lidt overrasket over, at det allerede var min tur. Men tak, formand, og tak til SF for endnu en gang, skulle jeg til at sige, at sætte kunstig intelligens på dagsordenen. Jeg tror, vi alle sammen er klar over, at det her er et emne, der ligger fru Lisbeth Bech-Nielsen på sinde, og det er også en entusiasme, som vi i Radikale Venstre deler. For der er ingen tvivl om, at denne nye teknologi allerede har haft og vil få enorm betydning for alle dele af vores samfund. Det er også korrekt, at der er udfordringer i, at de mest udbredte sprogmodeller er trænet i nogle helt enorme datasæt, der kommer fra lande uden for Danmark.

Men selv om vi deler mange af de synspunkter, som SF præsenterer i forslaget her, så kommer vi ikke til at stemme for det, som det foreligger. Jeg er ikke overbevist om, hvad der er den rette vej til målet, også selv om jeg egentlig er enig i målet om en dansk sprogmodel. Er det bedst at målrette midler til en sprogmodel, en statslig sprogmodel, eller er det at arbejde for at fritstille de relevante data, vi har fra eksempelvis Rigsarkivet, Lex.dk, Det Kongelige Bibliotek og DR, som er blevet nævnt af en tidligere ordfører, osv.? Jeg hælder nok mest til det sidste og derefter at lade andre aktører om at udvikle selve modellen. Ordførerne er ganske givet også bevidst om, at størrelsen på træningsdatacenteret er helt afgørende for kvaliteten og anvendeligheden af den udviklede model. Hvad ved vi i dag om dette forhold, når vi ser på tilgængeligheden af dansk data sammenlignet med de engelsksprogede modeller? Er der noget, vi skal være særlig opmærksomme på? Det trænger jeg også til at få belyst.

Ordførerne nævner i forslaget her også behovet for modeller, der er målrettet specifikke områder, og sundhed og forskning bliver nævnt som eksempler. Men her er der også en række udfordringer, vi skal være opmærksomme på. Inden for sundhed er der helt oplagte problemer med personfølsomme data, men også med at kombinere dansk praksis med international viden om behandlinger, og hvis der menes mere sygdomsspecifikke modeller baseret på såkaldt kunstig intelligens, så findes og anvendes de jo allerede i udstrakt grad derude. Inden for forskningen er der en række områder, hvor en relevant model skal håndtere ikke bare dansk, men i høj grad også engelsk og andre sprog, da forskning jo er en international beskæftigelse. Så er en dansk sprogmodel løsningen her? Jeg er ikke sikker. Jeg er heller ikke sikker på, at de forskellige felter vil have lyst til og gavn af at benytte den samme grundmodel. Så også her er der i hvert fald for mit eget vedkommende et behov for et bedre fagligt fundament at stå på. Vi har jo også som nævnt af flere andre vedtaget en digitaliseringsstrategi, hvor der bliver afsat midler til netop kunstig intelligens, som skal udmøntes af aftalekredsen bag den. Her vil denne debat være helt oplagt at tage, og jeg kan også nævne, at vi i forskningsreserven for i år afsatte 100 mio. kr. til forskning i kunstig intelligens. Så også her er der altså mulighed for forskningsgrupper, der ønsker at arbejde med det her område, at søge midler til deres forskning.

Jeg ser frem til, at vi i udvalget skal snakke endnu mere om dette emne. Jeg er sikker på, at det ikke er sidste gang, og forhåbentlig kan vi snart få en eksperthøring, så vi alle sammen kan beslutte os på et mere oplyst grundlag. For det mener jeg er den rette vej at gå. Så vil jeg gerne undskylde over for den tidligere ordfører, for jeg mener, at det, at ordet tilgængeliggørelse, eller hvad det var, kom til at stå i aftaleteksten, er min skyld, så jeg beklager meget. Tak for ordet.

Tak til Radikale Venstre. Den næste ordfører på talerstolen er hr. Peter Kofod fra Dansk Folkeparti.

Tak for det, og tak til SF for at fremsætte det her forslag, og det er jo faktisk altid, synes jeg, enormt charmerende med de forslag, der kommer fra SF, og jeg har sagt det før fra den her talerstol. For SF er jo et af de meget få partier – eller måske det eneste parti – i Folketinget, der i den grad har været med til at sætte det her emne på dagsordenen og sørge for, at det er noget, man jævnligt kommer til at diskutere i Folketinget, og det synes jeg egentlig er enormt givtigt. Jeg vil på samme måde som Liberal Alliances ordfører sige, at det faktisk er et forslag, som vi i vores folketingsgruppe har brugt mere tid på diskutere, end man måske lige skulle tro, fordi det giver anledning til en lidt bredere diskussion af, hvad vi egentlig kan forvente os af den kunstige intelligens, hvordan vi har tænkt os at regulere den og styre den, og hvad det er for nogle værdier, den kommer til at trække ned over hovedet på os, som måske er formet i et samfund, i et land på den anden side af Atlanterhavet, hvor synet på livet er anderledes.

Forslaget beskriver eksemplet med barnevognen, og det er der så nogle ordførere der siger er blevet rettet ind, siden forslaget er blevet skrevet, men ikke desto mindre er det jo sandt, at der er forskel på, hvordan vi lever, og hvordan vi ser verden, og at det selvfølgelig også har en betydning for, hvordan den kunstige intelligens kommer til at virke. Det er måske den største og den vigtigste opfindelse i den her ende af menneskehedens historie, og det kommer til at påvirke os så meget, og det kommer til at påvirke synet på verden og alt, hvad der er omkring os, og vi ved jo faktisk endnu ikke helt, hvad konsekvenserne af det bliver. Danmarksdemokraternes ordfører nævnte også noget, som jeg synes var enormt klogt, og det var beskyttelsen af sproget, som er meget vigtigt, og det kan jeg fuldstændig tilslutte mig, og det synes vi også er meget relevant.

Så er der det med pengene, og der er nogle, der siger, at det her koster 1 milliard, og så er der nogle, der siger, at det koster 40 mio. kr., for det står i forslaget, og så er der igen nogle, der siger, at det bliver endnu billigere. Det kan vi nok få udboret og finde ud af, hvad der egentlig er den reelle pris på det her forslag, og så må vi jo diskutere det. Jeg har det nok sådan, at jeg synes, der er noget charmerende rigtigt i det her forslag, og at jeg derfor helt klart også hælder imod at støtte det. I hvert fald vil jeg meget gerne diskutere det i udvalget og finde ud af, hvordan man kan komme videre med det. Om det så er ved en høring, som den radikale ordfører foreslog, kunne jo godt være. Men det må tiden vise. Vi er i hvert fald klart i den positive ende i forhold til det her forslag. Tak.

Tak til Dansk Folkeparti. Næste ordfører på talerstolen er fru Christina Olumeko fra Alternativet. Værsgo.

Tak for ordet. Jeg vil starte med en lidt kluntet indledning, som ChatGPT har skrevet til mig:

I lyset af den aktuelle diskussion i Folketinget anført af Socialistisk Folkeparti og støttet af Alternativet understregedes behovet for udvikling af en dansk sprogmodel. Dette initiativ er en udspringer af en anerkendelse af, at amerikanske sprogmodeller ikke fuldt ud kan inkorporere EU's og Danmarks unikke værdier og regelsæt. Der er et presserende behov for at sikre, at kunstig intelligens fuldt ud kan integreres og anvendes inden for danske rammer uden risiko for misforståelser eller fejl, der kan opstå ved anvendelsen af modeller trænet på primært engelsksproget indhold.

Og så vil jeg spare jer for resten og gå tilbage til en mere menneskelig tale.

I Alternativet er vi enige i, at vi bør finansiere en dansk sprogmodel. Vi vil gerne takke SF for et rigtig godt forslag. En dansk sprogmodel kan netop, som SF også selv fremfører, sikre national uafhængighed fra udenlandske sprogmodeller, som ikke nødvendigvis tager højde for lokale værdier og normer og regelsæt. Og så mener vi også, at en dansk sprogmodel er vigtig for at styrke datasikkerhed og gennemsigtighed med modellen.

Samtidig er det også vigtigt for Alternativet, at en dansk sprogmodel, hvis vi skulle få flertal for sådan en en dag, er open source. Open source skaber nemlig åbenhed omkring sprogmodellens arkitektur og parametre. Samtidig undgår vi også med open source monopollignende tilstande, som hæmmer innovation og gør det dyrt at udbyde og modtage service. Det ser vi f.eks. nu, hvor flere kommuner og offentlige institutioner presses på økonomien af Microsofts monopol på en række softwareprogrammer.

Vi skal skabe et digitalt bæredygtigt Danmark, og det er et samfund, der er baseret på samarbejde frem for konkurrence, og hvor deling gavner alle, og det betyder, at open source skal være centralt i alle vores digitale systemer, også når det gælder udvikling af en dansk sprogmodel og i det hele taget også kommercielle sprogmodeller.

Tak for ordet, og tak til SF for et vigtigt og visionært forslag.

Tak til Alternativet. Til slut er det ordføreren for forslagsstillerne, fru Lisbeth Bech-Nielsen fra Socialistisk Folkeparti.

Tak for en god debat. Jeg er også glad for at høre, at det her er noget, som vi på tværs af partier synes er vigtigt, spændende og værd at diskutere. Så kan det godt være, at vi ser forskelligt på det.

Jeg vil gerne lave nogle nedslagspunkter på nogle af de ting, der har været oppe at vende. Først må jeg sige, at som medlem af Finansudvalget, hvor vi betaler den ene milliard efter den anden for it-systemer, der er mere eller mindre vellykkede, ofte udarbejdet af private leverandører til staten, synes jeg, at det er en smule morsomt at høre, at et forslag til 40 mio. kr. simpelt hen er for dyrt – endda når det er noget, som pengene er sat af til i digitaliseringsstrategien, skulle man have lyst til at virkeliggøre det.

Så er det helt rigtigt, som flere har sagt, at noget af det, der ikke er med i forslaget i forhold til økonomien, selvfølgelig er driften og udviklingen af det bagefter. For sprogmodeller er organiske væsener, kunne man nærmest sige. De skal leve og udvikle sig og lære, og det er også derfor, at ChatGPT i dag ved, at man godt må stille en barnevogn udenfor i Danmark, men ikke vidste det for bare få måneder siden. Den lærer af brugerne. Derfor er det også vigtigt, at der er nogen bag ved skærmen så at sige, der kan afhjælpe fejlene, og som kan blive ved med nærmest at pleje den. Og det koster penge.

Men det koster også penge at drive en offentlig sektor. Det koster også penge i dag at bruge computerprogrammer og betale licenser og alt muligt andet. Bare for få dage siden var diskussionen oppe at vende igen om, hvordan det offentlige Danmark bare betaler mere og mere til Microsoft i form af licenser, fordi der de facto er et monopol nu. Det ser vi på en lang række områder, altså at vi får monopollignende tendenser, fordi bl.a. amerikanske techgiganter sidder på mange af de her løsninger, men det kunne i princippet også være alt muligt andet.

Det, der er meningen med det her forslag, er at sige, hvordan vi kan have noget, der er rigtig smart, og som er fremtiden. Det er allerede nutiden, og det er noget, vi alle sammen kommer til at bruge. Hvordan kan vi have noget, som man kan bruge i forsvaret, sågar i FE og PET, eller på Rigshospitalet eller i Slagelse Kommune, eller hvor det nu er, og vide, at man kan fodre den med borgernes sensitive data, sundhedsdata og sågar statshemmeligheder, uden at det ryger via en sky til nogle, der ikke skal have fingrene i det, samtidig med at vi overholder loven?

Som det er i dag, bryder vi loven, når Aula ligger på en AWS-server, og vores børns data ligger på en server, hvor der ikke er indgået GDPR-medholdelige aftaler. Vi bryder loven hver eneste dag, når vores børn i folkeskolen skal bruge googleprogrammer, som der ikke er lavet GDPR-medholdelige aftaler med. Og det er den systemafhængighed, som vi har sat os selv i, fordi vi har digitaliseret blindt i det her land uden at tænke over, hvad det er for nogle afhængighedsforhold, vi sætter os selv i.

Derfor skal vi gøre det rigtigt den her gang. Vi kan ikke gøre det om 1 år, 2 år eller 3 år. Vi skal i gang nu – for hver dag der går, bliver vi viklet mere og mere ind i nogle afhængighedsforhold. Og ja, der findes Copilot, og der findes alle de her supersmarte ting, men vi kan ikke fodre den med sensitive data, fordi der ikke er lavet de aftaler, som kan sikre, at danske borgeres data forbliver på europæisk jord.

Derfor bliver vi nødt til at have noget andet. Det kunne i virkeligheden godt være franske Mistral eller andet. Jeg siger ikke, at det skal være dansk; jeg synes bare, at der er nogle fordele ved det danske program. Og vi skal ikke starte fra scratch, for de danske universiteter har lavet et samarbejde med Alexandra Instituttet, så de er allerede i gang med de her Danish Foundation Models, som de træner.

Nogle af grundene til, at den her rapport, der hele tiden bliver hevet frem, og som siger, at det koster over 1 mia. kr., tager så gruelig fejl, er, at den overvurderer omkostningerne ved GPU. Den overdriver omkostningerne ved de her lokale løsninger. Den tager ikke med, at danske forskere har adgang til LUMI og Leonardo, som private aktører ellers skulle betale millioner og milliarder af kroner for. Den tager ikke med, at danske forskere har en privilegeret adgang til sundhedsdata, til borgernes data, som er ulovligt for kommercielle aktører at have adgang til.

Så netop ved at have sådan et offentlig-privat partnerskab har du adgang til nogle data, som private aktører ikke har. Og selv hvis de skulle lave de aftaler, som det her forskersamarbejde allerede har med Det Kgl. Bibliotek og lex.dk osv., vil det koste kassen. Så det kan ikke betale sig for en privat aktør at udarbejde en model. Selv hvis det kunne – det kan ikke gøres for de her penge – har jeg ikke set noget i horisonten, der viser, at vi vil få det inden for en kort årrække. Det er derfor, vi skal gå i gang. Det, som professorerne i kunstig intelligens fra Syddansk Universitet, fra AU, fra Københavns Universitet osv. er i gang med, er allerede et offentlig-privat samarbejde.

Der har været meget fokus på sprog og kultur – det er vigtigt for os i SF. Men det er misvisende at kalde det her én stor dansk sprogmodel, for i virkeligheden er det jo en basismodel, der skal ud at virke lokalt og trænes videre, så den lokalt på Rigshospitalet bliver god til sundhed og medicin osv., og så den i en kommune bliver god til at forstå serviceloven osv. osv. Derfor bliver det jo en masse lokale modeller, der skal ud at virke.

Vi ved jo godt, at f.eks. OpenAI med ChatGPT også tilbyder de her lokale modeller, hvor de siger, at det er et lukket kredsløb, så man rolig kan proppe sensitive data i den. Men hvem ejer det? Det er stadig væk en amerikansk techgigant, der gør det. Vi skal ikke give nøglerne til kritisk infrastruktur til nogle, der kan beslutte at hæve prisen i morgen, sådan som Microsoft har gjort med licenserne til det offentlige Danmark, eller skabe den form for systemafhængighed, vi lige nu ser med Googles produkter i de danske skoler. Det her skal ikke ud at konkurrere med nogen af de store modeller, der er derude lige nu. Det er slet ikke det, der er meningen. Meget mindre kan gøre det.

Lige nu bryder vi loven hver eneste dag med åbne øjne, fordi det er et af de der vilde problemer, som man ikke kan se sig selv komme ud af i Helsingør Kommune eller alle de andre kommuner, når man skal til at stoppe med at bruge de systemer, man bruger, eller de microsoftprogrammer, som man er tvunget til at bruge ude i kommunerne, fordi man ikke har et alternativ.

Vi skal gøre det rigtigt den her gang. Det er derfor, vi skal have en sprogmodel. Og den skal ikke være statslig, som flere har sagt. Det skal være noget, som vi alle sammen ejer i fællesskab, og som vi finansierer, så vi sender penge i retning af det her offentlig-private samarbejde, der allerede findes derude. Og så skal det være en open source model, der er tilgængelig for dem, der har lyst til at bruge den, også hvis det skulle være en virksomhed, der siger, at de ikke ligesom Samsung vil lave en fejl, hvor de sender forretningshemmeligheder ud i en chatbot og ikke ved, hvor det ender henne. Det var jo noget af det, der skete, da ChatGPT kom frem. Så det er noget, som alle vil kunne bruge.

Jeg er sikker på, at vi får en sprogmodel, men jeg tror bare, at vi kommer til at gøre det lidt sent. Jeg er rigtig bange for de systemafhængigheder og produktafhængigheder, som vi kan se at vi har fået på andre områder, og at vi også får viklet os selv ind i det her, i forhold til at de techgiganter, hvis produkter vi allerede bruger i dag – altså Microsoft og Google osv. – inkorporerer deres sprogmodeller i deres produkter. Så vi har brug for at gøre det rigtigt den her gang, og også gerne i samarbejde med de andre nordiske lande, hvis det var den vej, vi skulle gå.

Jeg har tilladt mig at give jer noget mere materiale, så I kan dykke lidt mere ned i de her ting, bl.a. i forhold til prisen, men også, hvorfor det netop er det her offentlig-private samarbejde og universitetssamarbejde, der allerede eksisterer, der er den vej, vi skal gå. De har adgang til europæiske supercomputere. De har en privilegeret adgang til data, som det er ulovligt for kommercielle aktører at have adgang til. Og de har adgang til de data, som Det Kgl. Bibliotek og lex.dk og andre ligger inde med, og som ville være noget, som en privat, kommerciel aktør skulle betale kassen for.

Så jeg er sikker på, at vi ender det rigtige sted på et tidspunkt, men vi kommer desværre nok til at spilde lidt tid, før vi er der. Men tak for debatten.

Der er en række korte bemærkninger. Den første er fra fru Christina Olumeko Alternativet.

Tak til ordføreren for en rigtig fin tale; jeg synes, den var virkelig god. Og også tak for de materialer, som du har delt ud til os alle sammen – det synes jeg er meget tjekket.

Jeg har bare et enkelt spørgsmål. I bemærkningerne til beslutningsforslaget fremgår der et finansieringseksempel på, hvad det kunne koste, med udgangspunkt i GPT 3, som har kostet 5 mio. dollar, og i en dansk kontekst vil det så være 40 mio. kr. GPT 3 ligger, som det også er blevet nævnt før, et stykke væk fra, hvor teknologien er i dag, og jeg vil egentlig bare spørge ordføreren, om man kunne forestille sig, at en dansk sprogmodel med noget statslig medfinansiering kunne blive markant dyrere, men også markant billigere, f.eks. hvis man laver en model, der er lidt mindre ligesom den franske Mistral AI, så det bliver markant billigere. Så kunne ordføreren forklare lidt om de to forskellige spænd, der er i finansieringen?

Ordføreren.

Mistral, som er den franske, er jo et rigtig, rigtig godt eksempel. Den er faktisk 250 gange mindre, end GPT 4 er, men den fungerer jo til det, der er dens formål. Det er også derfor, jeg hele tiden advarer lidt mod at sammenligne, hvad det her skal bruges til, og hvad en ChatGPT kan bruges til. Det her skal jo bruges til formålsspecifikke funktioner, altså ChatSpot-funktioner så at sige, og derfor kan den sagtens have en meget mindre størrelse.

Prisen er jo som sagt ikke noget, jeg har fundet på. Det er noget, som det her forskersamarbejde vurderer at det vil koste. Så hvis man er meget optaget af, hvad det her kommer til at koste, skal man ikke fokusere så meget på, hvad det koster at udvikle modellen – det koster ikke ret meget i dag, også fordi man kan udvikle på ryggen af eksisterende modeller – men det er mere det at drive det og træne det videre og passe og pleje det så at sige. Og det skal man selvfølgelig være villig til at betale. Men altså, vi kommer til at betale for det her på den ene eller den anden måde, hvad enten det bliver til techgiganter eller til vores egen model.

Spørgeren. Nej, der var ikke flere korte bemærkninger. Så går vi videre i spørgerrækken til hr. Stinus Lindgreen, Radikale Venstre. Værsgo.

Tak for det. Og tak til ordføreren for en entusiastisk tale og for et godt og vigtigt forslag, som vi har debatteret her i salen i dag. Jeg er enig med ordføreren i, at der jo er bred enighed om, at det her er relevant og noget, vi skal tage stilling til.

Jeg har dog stadig væk nogle spørgsmål. Det er ikke sikkert, at ordføreren kan svare nu og her, men så kan vi jo drøfte det videre senere. For det første vil jeg sige i forhold til det materiale, vi har fået udleveret – og tak for det; jeg har fået det læst – at der er en fejl i tabel 1, så man ikke kan se overskriften. Så jeg vil meget gerne modtage det som pdf, som man kan læse overskriften på tabellen. For det andet vil jeg sige, at ordføreren jo klart er bevidst om, at der findes mange modeller derude, også store sprogmodeller, som kan forskellige ting, og hvor der er forskellige fordele og ulemper. De udvikles dagligt og bliver hele tiden bedre. Så hvordan kan vi vide, hvis vi vælger én vej at gå herhjemme, at vi vælger den rigtige? Hvad nu, hvis vi skulle have valgt en anden? Skulle vi have flere forskellige, så man kan vælge, hvad for en der passer bedst til det område, man har lyst til at videreudvikle inden for?

Jeg er stadig uklar på, hvordan vi skulle vide, hvilken vej der er den rigtige at gå, så vi ikke kommer til at satse på den forkerte hest. Har ordføreren tænkt over det?

Ordføreren.

Altså, det vigtigste for mig er, at vi får et værktøj derude, som vi kan bruge lovligt – og det skulle man jo tro var en selvfølgelighed, men det er det ikke, når vi kigger ud i det offentlige Danmark – og at det er værktøjer, som vi kan bruge, hvor vi sikrer, hvad skal man sige, det etiske i det: Hvad er det trænet på? Er det frembragt ved at bryde ophavsretten? Eller skal vi anvise en dansk-nordisk vej, hvor vi siger: Jamen vi har faktisk kollektive aftaler i Danmark? Vi laver aftaler med mediebranchen eller med kunstnerne eller musikerne, eller hvem det er.

Så det vigtigste for mig er, at vi får et værktøj, der er etisk ordentligt, som er lovligt, og som vi kan bruge effektivt, så vi heller ikke bliver slået tilbage til start, fordi vi lige pludselig sidder i en eller anden klemme, hvor det, vi bruger som Google Workspace, viser sig at være hamrende ulovligt.

Hr. Stinus Lindgreen.

Jeg er fuldstændig enig i forhold til det behov og i, hvor vigtigt det er, at vi har en model, der selvfølgelig er både lovlig og etisk. Det burde ikke være til diskussion overhovedet.

Men jeg kan ikke se, at der er noget af det, der er i modstrid med, at man stiller open source, som ordføreren og jeg begge er varme tilhængere af, til rådighed og lader andre aktører vælge den, som de har lyst til, den kodebase, de gerne vil bruge, og at vi så sørger for, at data er tilgængelige, så man kan bruge kodebasedata til at udvikle den model, man gerne vil have.

Samtidig nævner ordføreren også, at der jo er initiativer i gang – selvfølgelig er der det og ganske givet flere end det her – så hvad er det, vi mangler? Hvad er det, der ikke allerede sker, som skulle ske, hvis vi sagde ja til det her forslag?

Ordføreren.

Jamen der er jo netop et initiativ i gang på tværs af efterhånden samtlige danske universiteter, som er med i det her samarbejde, hvor Alexandra Instituttet også er med. Så det er jo slet ikke sådan, at vi politisk skal pege på den ene eller den anden teknologi eller på, hvordan man laver det. Jeg har jo bare opdaget, at det her arbejde er i gang, og det er godt i gang. Og vi kan komme i mål for ret få penge. Men det er lige så meget den politiske beslutning om, at vi siger, at det her er kritisk infrastruktur og det skal vi have.

Hr. Christoffer Aagaard Melson fra Venstre.

Tak for det. Jeg har lige et spørgsmål om den her store frygt for, at man lige netop på det her område ikke kan lave nogle rammer, der sikrer, at private leverandører også kan levere kritisk infrastruktur, der er sikker og overholder reglerne. Altså, på tværs af vores samfund er det jo private, der leverer vores kritiske infrastruktur, om det er bankvæsenet eller det er vores militær eller det er it-systemerne til vores efterretningstjeneste eller serverne, som vores forsvar kører de mest sensitive ting på. Det er jo ikke noget, vi i staten er eksperter i, og derfor laver vi nogle rammer og nogle krav, og så køber vi det hos private leverandører. Jeg har bare svært være at få det ind i hovedet. Hele vores telenet er jo drevet af private i Danmark. Vi har nogle krav og nogle rammer, som de lever op til, og det synes jeg har været en ret stor succeshistorie, for det liberaliserede det.

Så jeg vil bare lige høre, om ordføreren kan oplyse mig lidt om, hvad det er, der er så unikt ved det her, at ordføreren tror, det er helt umuligt at få private til at løfte den her opgave, hvis vi sætter nogle rammer og også er villige til at betale for det.

Ordføreren.

Jamen det kan sagtens være, at der er nogle private, der vil gå ned ad den vej; jeg har bare ikke hørt om, at der er nogen private, der vil gå ned ad den vej og opfylde de ting, som jeg nævnte var vigtige. Forskellen mellem det her og at lave et it-system – og nu skal jeg passe på med at sige, at det er nemt at lave et it-system, for historien er fyldt med forfærdelige eksempler – er jo i forhold til det med de store sprogmodeller, at de skal trænes med gigantiske mængder af data. Det behøver jeg selvfølgelig ikke at belære ordføreren om, for det ved han jo udmærket. Og det gode ved at gå den vej med det forskningssamarbejde, der allerede er, er jo, at de har adgang til den mængde data, og at de har adgang til europæiske supercomputere, så de ikke ligesom skal ud at købe sig adgang til at få trænet med det her, og at de har privilegeret adgang til sundhedsdata og andet, som private aktører ikke har. Og de professorer, som jeg har talt med, har sagt: Normalt ville vi jo slet ikke blande os i, hvad der skal være kritisk infrastruktur eller ej, men vi er bare bekymrede for, hvad der sker med vores land, hvis vi ikke går ad den vej, og hvis vi ikke har noget, som man kan bruge i f.eks. den offentlige forvaltning.

Spørgeren.

Tak. Det er jeg nok bare grundlæggende lidt uenig i. Jeg tror, at den viden og den forskning, der er på vores universiteter, også sagtens kan bringes i spil i privat regi ved et tæt samarbejde med den private sektor, og ved at vi bliver bedre til at kommercialisere den viden, der ligger i vores offentlige sektor. Jeg har mine tvivl om, hvorvidt et universitetssamarbejde over tid kan være lige så agilt i forhold til de krav, som dem, der skal bruge vores data og skal operationalisere dem i dagligdagen, har brug for, som hvis vi lod nogle private udvikle løsningerne. Men jeg er glad for, at man måske ikke er helt så kategorisk omkring det her med, at man ikke tror, at private også kan levere på det her område. For jeg synes også, at vi skal passe på, at vi ikke skaber en frygt derude.

Ordføreren.

Altså, det samarbejde, der er, og det, der foregår med universiteterne lige nu, er et offentlig-privat samarbejde. Men hvorfor er det her anderledes? Det er jo anderledes på den måde, at når du stiller en chatrobot et spørgsmål – det kunne være: Hey, jeg har fået den her mail fra Ulla i Vejle, og hun har leveret en masse private oplysninger om sine børn, og jeg er hendes sagsbehandler osv. – så kan vi selvfølgelig ikke have, at det ligger i en cloud, eller at de data bliver sendt tilbage til USA. Og det er den virkelighed, vi ser ind i lige nu, nemlig at vores børns oplysninger i Aula ligger på en AWS-server , og at de googleprogrammer, man bruger i folkeskolen, er erklæret ulovlige af Datatilsynet.

Tak til ordføreren for forslagsstillerne.

Der er ikke flere, der er bedt om ordet. Forhandlingen er sluttet – og det gør ikke noget.

Jeg foreslår, at forslaget til folketingsbeslutning henvises til Udvalget for Digitalisering og It. Hvis ingen gør indsigelse, betragter jeg det som vedtaget.

Det er vedtaget.