Dansk sprogmodelprojekt går ind i ny fase med stærkere national regnekraft

Hvordan sikrer man, at fremtidens kunstige intelligens forstår det dansk sprog, danske institutioner og danske samfundsforhold – og samtidig håndterer data under rammer, vi selv har kontrol over?

Det spørgsmål er centralt i forskningsprojektet Danish Foundation Models (DFM), hvor Syddansk Universitet, Aarhus Universitet, Københavns Universitet og Alexandra Instituttet samarbejder om at udvikle åbne danske sprogmodeller. Projektet har været i gang i nogen tid, og forskerne har allerede udgivet de første modeller, etableret benchmarks og sat samarbejder i gang med eksterne partnere. Nu står projektet foran næste fase.

Med ny national supercomputerkapacitet, BITTEN, som åbnede i Sønderborg i Maj, hvor forskningsplatformen UCloud er indgangen, kan tempoet i udviklingen stige markant.

Kultur, normer og samfundsforståelse går tabt

Sprogmodeller er på få år blevet strategisk teknologi. De bruges allerede til tekstproduktion, søgninger, til at assistere med beslutningstagning, automatisering og analyse. Men de mest udbredte modeller er udviklet af globale virksomheder og trænet primært på engelsk eller andre udbredte sprog.

Det giver begrænsninger, når modellerne skal bruges i en dansk virkelighed.

Hvis man kigger ned i detaljerne, er mange internationale modeller faktisk dårlige til dansk. Den måde, de formulerer sig på, minder ofte om engelsk oversat til dansk. Det er ikke sådan, vi taler eller skriver, siger professor Peter Schneider-Kamp fra Syddansk Universitet, der står i spidsen for DFM, fra SDU’s side.

Det gælder ikke kun sproget. Det gælder også kultur, normer og samfundsforståelse.

DFM har blandt andet udviklet danske benchmarks, der tester modeller på dansk kulturviden. Her klarer selv de største internationale modeller sig ofte svagt.

De mangler indsigt i, hvordan Danmark fungerer – i vores litteratur, vores offentlige sektor, vores sundhedsvæsen og vores kulturelle referencerammer, forklarer Schneider-Kamp.

Danmark kan ikke stå udenfor

Udviklingen inden for AI går så hurtigt, at adgang til egne kompetencer og egen infrastruktur bliver stadig vigtigere. Ifølge Schneider-Kamp er det risikabelt at antage, at andre lande fortsat vil levere de tjenester og modeller, Europa har brug for, i al fremtid.

Vi kan ikke bare regne med, at amerikanske eller kinesiske virksomheder stiller de rigtige løsninger til rådighed for os for evigt. Vi er nødt til selv at være med i udviklingen, siger han.

Her handler det ikke om at kopiere Silicon Valley i skala, men om at kunne udvikle målrettede løsninger til danske behov – og gøre det på et gennemsigtigt og ansvarligt grundlag.

Vi vil gerne have modeller, hvor vi ved, hvad de er trænet på, som overholder GDPR og AI-forordningen, og som har styr på dansk sprog, dansk kultur og danske normer, siger han.

UCloud er rygraden

Bag projektet ligger en mindre synlig, men afgørende del af historien: forskningsinfrastrukturen.

DFM udvikles i høj grad ved brugen af UCloud, den nationale platform for interaktiv højtydende computing, udviklet af SDU eScience Center i samarbejde med partnere. Her får forskere adgang til lagerkapacitet, GPU’er, software og samarbejdsværktøjer i ét samlet miljø.

For Peter Schneider-Kamp er UCloud helt central.

UCloud er vores sikre miljø, hvor vi udvikler modeller, træner modeller, lagrer data og evaluerer dem. Det er meget centralt i det, vi laver, siger han.

Sikkerhedsperspektivet er væsentligt. Når forskere arbejder med store datamængder – og i nogle projekter også følsomme data – er det afgørende, at data kan håndteres i et kontrolleret miljø.

Hvis vi får nye datasæt fra for eksempel biblioteker, medier eller andre kilder, kan vi opbevare dem sikkert, arbejde direkte på dem og bevare kontrollen over dataene, siger han.

Alternativet vil ofte være mere tunge og fragmenterede løsninger, hvor data skal flyttes mellem systemer og lande.

Ny national supercomputer BITTEN

Den 5. maj 2026 blev en ny national supercomputer indviet i Sønderborg: BITTEN. Anlægget er etableret af Syddansk Universitet i samarbejde med Danfoss og Hewlett Packard Enterprise (HPE) og er en del af den danske forskningsinfrastruktur inden for kunstig intelligens, avancerede beregninger og datatung forskning.

Supercomputeren stilles til rådighed gennem UCloud, så forskere og studerende på universiteter i hele landet kan få adgang via eksisterende systemer og arbejdsgange.

Samarbejdet forener SDU’s erfaring med forskningsinfrastruktur, Danfoss’ kompetencer inden for energieffektive køle- og varmeløsninger samt HPE’s ekspertise i supercomputing og datacenterteknologi.

Anlægget er samtidig udviklet med fokus på energieffektiv drift og genanvendelse af overskudsvarme.

Kapacitetsmangel bremser forskning

For AI-forskning er adgang til regnekraft ikke et luksusproblem, men en forudsætning.

Tidligere oplevede DFM-gruppen jævnligt flaskehalse, når modeller skulle trænes.

Nogle gange har vi oplevet at vente to, tre, fire eller fem dage på at få fat i en GPU. Imens sidder ph.d.-studerende og postdocs klar med idéer og kode, men bliv bremset af manglende ressourcer, siger Peter Schneider-Kamp.

Det er netop her, den nye kapacitet kan gøre en forskel.

Mere regnekraft betyder hurtigere eksperimenter, større modeller, flere iterationer og kortere vej fra idé til resultat.

Vi håber, det vil give os hurtigere omsætning fra idéer til forskningsresultater og konkrete use cases! Vi glæder os helt vildt til at få adgang til de de langt flere GPU’er, siger han.

Mere end teknologi

DFM handler derfor om mere end software og hardware. Projektet illustrerer, hvordan forskning, digital suverænitet, datasikkerhed og innovation hænger tæt sammen.

Hvis Danmark vil bruge AI i sundhedsvæsenet, den offentlige sektor, uddannelserne og erhvervslivet, kræver det løsninger, man kan forstå, tilpasse og have tillid til.

Med UCloud som arbejdende rygrad og ny national supercomputerkapacitet BITTEN, står Danish Foundation Models nu et sted, hvor arbejdet kan bevæge sig fra lovende opbygning til bredere anvendelse.

Spørgsmålet er ikke længere kun, om Danmark kan udvikle egne sprogmodeller.

Spørgsmålet er, om vi har råd til at lade være.

Læs mere om DFM projektet her