Tak for en god debat. Jeg er også glad for at høre, at det her er noget, som vi på tværs af partier synes er vigtigt, spændende og værd at diskutere. Så kan det godt være, at vi ser forskelligt på det.
Jeg vil gerne lave nogle nedslagspunkter på nogle af de ting, der har været oppe at vende. Først må jeg sige, at som medlem af Finansudvalget, hvor vi betaler den ene milliard efter den anden for it-systemer, der er mere eller mindre vellykkede, ofte udarbejdet af private leverandører til staten, synes jeg, at det er en smule morsomt at høre, at et forslag til 40 mio. kr. simpelt hen er for dyrt – endda når det er noget, som pengene er sat af til i digitaliseringsstrategien, skulle man have lyst til at virkeliggøre det.
Så er det helt rigtigt, som flere har sagt, at noget af det, der ikke er med i forslaget i forhold til økonomien, selvfølgelig er driften og udviklingen af det bagefter. For sprogmodeller er organiske væsener, kunne man nærmest sige. De skal leve og udvikle sig og lære, og det er også derfor, at ChatGPT i dag ved, at man godt må stille en barnevogn udenfor i Danmark, men ikke vidste det for bare få måneder siden. Den lærer af brugerne. Derfor er det også vigtigt, at der er nogen bag ved skærmen så at sige, der kan afhjælpe fejlene, og som kan blive ved med nærmest at pleje den. Og det koster penge.
Men det koster også penge at drive en offentlig sektor. Det koster også penge i dag at bruge computerprogrammer og betale licenser og alt muligt andet. Bare for få dage siden var diskussionen oppe at vende igen om, hvordan det offentlige Danmark bare betaler mere og mere til Microsoft i form af licenser, fordi der de facto er et monopol nu. Det ser vi på en lang række områder, altså at vi får monopollignende tendenser, fordi bl.a. amerikanske techgiganter sidder på mange af de her løsninger, men det kunne i princippet også være alt muligt andet.
Det, der er meningen med det her forslag, er at sige, hvordan vi kan have noget, der er rigtig smart, og som er fremtiden. Det er allerede nutiden, og det er noget, vi alle sammen kommer til at bruge. Hvordan kan vi have noget, som man kan bruge i forsvaret, sågar i FE og PET, eller på Rigshospitalet eller i Slagelse Kommune, eller hvor det nu er, og vide, at man kan fodre den med borgernes sensitive data, sundhedsdata og sågar statshemmeligheder, uden at det ryger via en sky til nogle, der ikke skal have fingrene i det, samtidig med at vi overholder loven.
Som det er i dag, bryder vi loven, når Aula ligger på en AWS-server, og vores børns data ligger på en server, hvor der ikke er indgået GDPR-medholdelige aftaler. Vi bryder loven hver eneste dag, når vores børn i folkeskolen skal bruge googleprogrammer, som der ikke er lavet GDPR-medholdelige aftaler med. Og det er den systemafhængighed, som vi har sat os selv i, fordi vi har digitaliseret blindt i det her land uden at tænke over, hvad det er for nogle afhængighedsforhold, vi sætter os selv i.
Derfor skal vi gøre det rigtigt den her gang. Vi kan ikke gøre det om 1 år, 2 år eller 3 år. Vi skal i gang nu – for hver dag der går, bliver vi viklet mere og mere ind i nogle afhængighedsforhold. Og ja, der findes Copilot, og der findes alle de her supersmarte ting, men vi kan ikke fodre den med sensitive data, fordi der ikke er lavet de aftaler, som kan sikre, at danske borgeres data forbliver på europæisk jord.
Derfor bliver vi nødt til at have noget andet. Det kunne i virkeligheden godt være franske Mistral eller andet. Jeg siger ikke, at det skal være dansk; jeg synes bare, at der er nogle fordele ved det danske program. Og vi skal ikke starte fra scratch, for de danske universiteter har lavet et samarbejde med Alexandra Instituttet, så de er allerede i gang med de her Danish Foundation Models, som de træner.
Nogle af grundene til, at den her rapport, der hele tiden bliver hevet frem, og som siger, at det koster over 1 mia. kr., tager så gruelig fejl, er, at den overvurderer omkostningerne ved GPU. Den overdriver omkostningerne ved de her lokale løsninger. Den tager ikke med, at danske forskere har adgang til Loom og Leonardo, som private aktører ellers skulle betale millioner og milliarder af kroner for. Den tager ikke med, at danske forskere har en privilegeret adgang til sundhedsdata, til borgernes data, som er ulovligt for kommercielle aktører at have adgang til.
Så netop ved at have sådan et offentlig-privat partnerskab har du adgang til nogle data, som private aktører ikke har. Og selv hvis de skulle lave de aftaler, som det her forskersamarbejde allerede har med Det Kgl. Bibliotek og lex.dk osv., vil det koste kassen. Så det kan ikke betale sig for en privat aktør at udarbejde en model. Selv hvis det kunne – det kan ikke gøres for de her penge – har jeg ikke set noget i horisonten, der viser, at vi vil få det inden for en kort årrække. Det er derfor, vi skal gå i gang. Det, som professorerne i kunstig intelligens fra Syddansk Universitet, fra AU, fra Københavns Universitet osv. er i gang med, er allerede et offentlig-privat samarbejde.
Der har været meget fokus på sprog og kultur – det er vigtigt for os i SF. Men det er misvisende at kalde det her én stor dansk sprogmodel, for i virkeligheden er det jo en basismodel, der skal ud at virke lokalt og trænes videre, så den lokalt på Rigshospitalet bliver god til sundhed og medicin osv., og så den i en kommune bliver god til at forstå serviceloven osv. osv. Derfor bliver det jo en masse lokale modeller, der skal ud at virke.
Vi ved jo godt, at f.eks. OpenAI med ChatGPT også tilbyder de her lokale modeller, hvor de siger, at det er et lukket kredsløb, så man roligt kan proppe sensitive data i den. Men hvem ejer det? Det er stadig væk en amerikansk techgigant, der gør det. Vi skal ikke give nøglerne til kritisk infrastruktur til nogle, der kan beslutte at hæve prisen i morgen, sådan som Microsoft har gjort med licenserne til det offentlige Danmark, eller skabe den form for systemafhængighed, vi lige nu ser med Googles produkter i de danske skoler. Det her skal ikke ud at konkurrere med nogen af de store modeller, der er derude lige nu. Det er slet ikke det, der er meningen. Meget mindre kan gøre det.
Lige nu bryder vi loven hver eneste dag med åbne øjne, fordi det er et af de der vilde problemer, som man ikke kan se sig selv komme ud af i Helsingør kommune eller alle de andre kommuner, når man skal til at stoppe med at bruge de systemer, man bruger, eller de microsoftprogrammer, som man er tvunget til at bruge ude i kommunerne, fordi man ikke har et alternativ.
Vi skal gøre det rigtigt den her gang. Det er derfor, vi skal have en sprogmodel. Og den skal ikke være statslig, som flere har sagt. Det skal være noget, som vi alle sammen ejer i fællesskab, og som vi finansierer, så vi sender penge i retning af det her offentlig-private samarbejde, der allerede findes derude. Og så skal det være en open source model, der er tilgængelig for dem, der har lyst til at bruge den, også hvis det skulle være en virksomhed, der siger, at de ikke ligesom Samsung vil lave en fejl, hvor de sender forretningshemmeligheder ud i en chatbot og ikke ved, hvor det ender henne. Det var noget af det, der skete, da ChatGPT kom frem. Så det er noget, som alle vil kunne bruge.
Jeg er sikker på, at vi får en sprogmodel, men jeg tror bare, at vi kommer til at gøre det lidt sent. Jeg er rigtig bange for de systemafhængigheder og produktafhængigheder, som vi kan se at vi har fået på andre områder, og at vi også får viklet os selv ind i det her, i forhold til at de techgiganter, hvis produkter vi allerede bruger i dag – altså Microsoft og Google osv. – inkorporerer deres sprogmodeller i deres produkter. Så vi har brug for at gøre det rigtigt den her gang, og også gerne i samarbejde med de andre nordiske lande, hvis det var den vej, vi skulle gå.
Jeg har tilladt mig at give jer noget mere materiale, så I kan dykke lidt mere ned i de her ting, bl.a. i forhold til prisen, men også, hvorfor det netop er det her offentlig-private samarbejde og universitetssamarbejde, der allerede eksisterer, der er den vej, vi skal gå. De har adgang til europæiske supercomputere. De har en privilegeret adgang til data, som det er ulovligt for kommercielle aktører at have adgang til. Og de har adgang til de data, som Det Kgl. Bibliotek og lex.dk og andre ligger inde med, og som ville være noget, som en privat, kommerciel aktør skulle betale kassen for.
Så jeg er sikker på, at vi ender det rigtige sted på et tidspunkt, men vi kommer desværre nok til at spilde lidt tid, før vi er der. Men tak for debatten.