Johannes Bjerva
MEDLEM AF DET UNGE AKADEMI
Johannes Bjerva
Titel
Lektor
Tilknytning
Institut for datalogi, Det tekniske fakultet for IT og design, Aalborg Universitet
Indvalgsår
2023
Grad
ph.d.
Fagområde
Sprogteknologi
HVAD ER DIT FORSKNINGSFELT – KORT BESKREVET?
Mit forskningsområde er sprogteknologi, også kendt som Natural Language Processing (NLP). Jeg arbejder med at gøre sprogteknologi mere tilgængelig, for mindre sprog og samfund i verden. De seneste metodologiske fremskridt inden for NLP, såsom f.eks. ChatGPT, kræver nemlig enorme mængder af data, hvilket mindre sprogsamfund aldrig vil være i stand til at opbygge. I mit nuværende forskningsprojekt forsøger vi at forbedre situationen gennem at bruge det, vi ved om sprog fra lingvistikkens side, til at informere vores modeller, der er baseret på kunstig intelligens.
HVAD HAR MOTIVERET DIG TIL AT BLIVE FORSKER?
I løbet af min bachelor og kandidat havde jeg muligheden for at være del af et meget aktivt forskningsmiljø som forskningsassistent på Institut for Lingvistik ved Stockholms Universitet. Det aktive forskningsliv inspirerede mig til at søge en ph.d.-stilling i Holland. Livet som forsker indebærer en arbejdsdag fyldt med små og store udfordringer, og giver en unik måde at give tilbage til samfundet på. Dels gennem at flytte barrierer inden for ens egen forskning, men også når det gælder at uddanne den næste generation af bachelorer, kandidater, og forskere. Fleksibiliteten, man har som forsker, både i arbejdstider og arbejdsopgaver, er endnu et stort plus for mig personligt.
HVAD ER DE FORSKNINGSMÆSSIGE UDFORDRINGER OG PERSPEKTIVER PÅ DIT FELT?
Sprogteknologi bygger på kunstig intelligens, og alle moderne metoder kræver absurde mængder af data for at fungere godt. Det har vi heldigvis i forvejen for større og rigere sprog som engelsk, spansk og kinesisk. Dansk er heller ikke helt dårligt stillet, men hvis vi kigger på mindre sprogsamfund som Færøerne og Grønland, er situationen en helt anden. Kort fortalt, vil moderne teknologier såsom store sprogmodeller, der ligger under f.eks. ChatGPT, aldrig fungere i sådanne samfund. Der er ikke nok data, og det vil ca. 50,000 mennesker heller aldrig være i stand til at skabe. Ud af de ca. 7000 sprog i verden, er der måske 700, der bruges i samfund og kontekster, der kan have gavn af denne slags teknologi – og ud af de 700 er der måske kun 50, der har ressourcerne.
I min forskning forsøger jeg at udvikle metoder til at sprogteknologi også kan fungere godt med små mængder data. Vejen derhen er at bruge det, vi ved om sprog, og hvordan de ligner hinanden med hjælp fra lingvistik. På den måde kan vi bruge data mere effektivt, låne data fra større sprog, og forhåbentlig også gøre teknologien tilgængelig for mindre samfund.
HVAD VIL DU BRUGE DIT MEDLEMSKAB AF DET UNGE AKADEMI TIL?
Med de seneste udviklinger inden for sprogteknologi ser jeg store muligheder for tværvidenskabeligt samarbejde med andre fagområder. Jeg håber på, at diskussioner med andre medlemmer kan stimulere til sådanne samarbejder og måske også deciderede tværvidenskabelige samarbejdsprojekter. Derudover håber jeg på, at få flere muligheder for forskningsformidling og at bidrage til samfundsdebatten med indspil fra akademiet baseret på en bredere faglighed, end jeg selv kan gøre med kun min egen faglige baggrund.
HVORDAN MENER DU, AT MAN KAN STYRKE TVÆRFAGLIGHEDEN – OG HVORDAN KAN DEN BRUGES I DIT ARBEJDE?
Det sker alt for tit, at forskere i fagområder med teknisk kunnen, som f.eks. datalogi, kommer med “løsningen” til problemer inden for f.eks. humaniora og social science. Det forestiller jeg mig ikke, der særlig ofte kommer noget produktivt ud af, der faktisk er til gavn for den tværvidenskabelige forskning. Jeg ser for mig, at det optimale vil være at sørge for, at domæneekspertisen fra et givet fagområde er i fokus, og at en mere metodologisk orienteret disciplin som min tager rollen som facilitator i at eksempelvis basere analyser på større mængder data.
LIDT OM MENNESKET BAG FORSKEREN
Jeg kommer oprindeligt fra Norge og er vokset op i et tosprogligt hjem med norsk og finsk. Jeg har flyttet rundt en del i mit liv – først til Sverige for at studere, derefter til Holland for min ph.d., inden jeg flyttede til Danmark i 2017 for at påbegynde en postdoc på KU. Nu er jeg bosat tæt på naturen i Farum med min kone og snart to døtre. I min fritid dyrker jeg triatlon og gennemførte Ironman i København i 2022. Nu forsøger jeg egentlig bare at holde mig nogenlunde i form, da den træningsmængde, der kræves for langdistance triatlon, for mig bliver for meget at balancere med familie og arbejde.