Uniavisen
Københavns Universitet
Uafhængig af ledelsen

Videnskab

Big data: »Det kan vi gøre meget bedre end newyorkerne«

ELITEFORSKER – Giv ham en by, og han kan fortælle dig alt om dens borgere. KU’s mister big data, David Dreyer Lassen, overbeviser internationalt med danske data.

Han stak en årgang studerende en smartphone. Små tusind mennesker lod sig villigt overvåge et år af Big Brother aka David Dreyer Lassen.

Via mobilerne fik forskerne mængder af værdifuld information om de studerendes gøren og færden. Hvis han skulle tættere på, skulle han være kravlet op på skødet af hver enkelt.

Forskningsprojektet, Social Fabric, der ledes af professor i økonomi David Dreyer Lassen, går nu ind i sin sidste, kreative, fase.

»Vi kan se, hvem de studerende snakker og sms’er med. Men vi kan også spore hvor de er, og hvem de er sammen med via Bluetooth. Hvor tæt er de sammen, og hvor længe? Er de kun sammen på campus, eller ses de også privat? Telefonen fungerer som en lille kortlægger af social interaktion og netværksdannelser,« siger David Dreyer Lassen.

Hvis bare man altid havde den energi

Han var ikke den første til at bruge smartphones, men instrumentet er sjældent anvendt på så stor en population, og derfor flokkes mange om projektets data, der er i særklasse, fortæller han:

»Jo mere detaljeret du gerne vil vide noget om folk, jo færre ved du det typisk om. Her har vi over et par år indsamlet utroligt interessante data, der nu bliver behandlet på alle niveauer og bliver til både forskningspapirer, ph.d.-afhandlinger og specialer.«

De big data, som undersøgelsen kaster af sig, er genstand for granskning dels på Det Samfundsvidenskabelige Fakultet, men også i tværfakultære KU-samarbejder og ud af huset til Danmarks Tekniske Universitet, DTU, hvor undersøgelsen har fundet sted. Og mulighederne er virkelig mange, siger David Dreyer Lassen:

»Det er så godt, meget af det, der er kommet ud af projektet, at vi meget nødig vil slippe det igen. Folk, der er med, er forbløffende begejstrede, og vi har også fået rigtig god respons fra de studerende, der har adgang til de her data. Det kommer jeg til at bruge en del tid på de næste par år. Og vi glæder os meget. I første omgang laver vi et nyt center, Copenhagen Centre for Social Data Science, som vi netop har annonceret (14. april, red.).«

Centeret kommer til at praktisere en art deleøkonomi:

»Det er målet, at vi skal kunne hjælpe andre forskere, der er interesserede i at hente data fx fra Facebook, Twitter eller nettet, som man ikke er vant til at kunne behandle. Det vil vi gerne kunne være dem behjælpelige med ved at dele ud af vores viden og erfaringer.«

Er Social Fabric lidt en darling for dig?

»Ja, på sin vis. Når man får så mange penge (16 millioner, red.) til et projekt, bliver man altid en lille smule bekymret for, om tingene nu lykkes. Man står med ansvaret, og vil folk nu levere? Her har folk løftet på en måde, så man ikke kan lade være at blive glad og begejstret. Hvis man altid havde den energi i et forskningsprojekt, ville alt bare være super fedt.«

Vil gerne kortlægge en hel by

David Dreyer Lassen har en vild ide. Han vil gerne skalere Social Fabric op og lave et lignende eksperiment med en hel by.

»Undersøgelsens studerende er jo en forholdsvis homogen gruppe, hvilket giver nogle videnskabelige fordele, for der er ting, der er nemme at holde snor i. Men det kunne være sjovt at se på social interaktion ude i det virkeligt virkelige liv.«

Økonomens taletempo bliver ivrigere, når han beskriver, det erkendelsespotentiale, han ser i de store data:

»Hvem er sammen med hvem? Hvordan interagerer forskellige mennesker med deres omgivelser? Hvordan er deres økonomiske adfærd? Og deres sundhedsmæssige? Hvordan bruger borgerne deres by? Dens infrastruktur, kultur, institutioner … Det kunne være rigtig interessant at gøre det i en skala, hvor alle – eller i hvert fald mange – var med.«

David Dreyer Lassen fortæller, at der kommer nye indsigter, når man krydser hidtil separate data:

»Vi har datasæt om økonomisk adfærd, men der ved vi ikke, hvem folk er venner med. Omvendt har vi i de datasæt, der handler om sociale netværk, ingen information om folks økonomiske adfærd. Med mobilen kan vi få dækket hele paletten.«

»Her kom pengene helt ud af det blå.« – David Dreyer Lassen om EliteForsk-Prisen på 1,2 millioner kroner

For tiden kører et projekt i New York, hvor de forsøger at skaffe penge til at følge 10.000 mennesker ret tæt, fortæller David Dreyer Lassen. Det er en drøm, der får hans datahjerte til at banke hurtigere:

»Det ville vi kunne gøre meget bedre i Danmark, for vi har langt bedre data på mange andre områder, og det er ekstremt spændende. Men det er en ide, som typisk er svær at skaffe midler til, fordi der ikke er en klar udsigt til politikændring eller et medikament, men en mere åben, undersøgende karakter. Det gad jeg godt!«

Naturlige eksperimenter

At David Dreyer Lassen har drevet den danske forskning med big data helt frem på de forreste sider i internationale tidsskrifter, skyldes en metode, han kalder ’naturlige eksperimenter’.

Et område, han har undersøgt, er vælgeradfærd. Veluddannede borgere stemmer i højere grad end kortuddannede. Det er dokumenteret igen og igen, fortæller han:

»Men den korrelation dokumenteres sjældent på en måde, der tillader os at give en klar årsagssammenhæng. Vi ved ikke om folk stemmer mere, fordi de er veluddannede. Inden for samfundsvidenskaben kan vi ikke lave et eksperiment, hvor nogle bliver langtuddannede og nogle kortuddannede, hvis det var det, vi gerne ville kigge på,« siger David Dreyer Lassen.

Her skitserer han samfundsvidenskabens særlige udfordring, der adskiller den fra naturvidenskabelig grundforskning:

»I naturvidenskaben kan man lave den slags eksperimenter, hvor en gruppe respondenter får piller og en anden får placebo, og alle videnskabelige principper om randomisering er overholdt. Hvis vi gerne vil give en kausal fortolkning af folks adfærd, er vi på samme måde nødt til at give dem en ændring i deres omstændigheder, som ikke skyldes dem selv.«

Men der ligger mange sten på den vej, fortæller David Dreyer Lassen, for hvis folk interesserer sig for politik, indhenter de også mere information, og det er derfor ikke underligt, hvis forskerne finder en sammenhæng, der siger, at mere informerede stemmer mere.

»At vi har kunnet sælge forskningsresultater med danske data til de bedste amerikanske tidsskrifter, det er jeg sgu stolt af.«

Så hvordan kan man undersøge om folk – på tværs af uddannelsesgrad – går til valg, hvis de er mere oplyste af information, de vel at mærke ikke selv har opsøgt?

»Jeg har brugt en folkeafstemning i København om bydelsstyre for 15 år siden, hvor man inddelte byen i 15 bydele og udså fire af dem til forsøgsbydele, der fik lov at køre en decentral model, hvor de styrede mange ting selv. Vælgerne i de fire bydele boede pludselig i en forsøgsbydel, hvor de fik mængder af information, som byens andre borgere ikke fik per automatik.«

Dette naturlige eksperiment tillod David Dreyer Lassen at konkludere en klokkeklar kausalitet: vælgerne i forsøgsbydelene stemte i højere grad til valg – simpelthen fordi de var velinformerede:

»Indbyggerne her vidste mere om hvordan bydelsstyret fungerede, for de levede i forsøgsperioden med de nye regler. Så det var en ydre påvirkning, der afgjorde om folk var bedre eller dårligere informeret.«

Dejlige danske data

Han skal trykkes lidt på maven, men David Dreyer Lassen medgiver, at han er stolt af de projekter, hvor han og kollegaerne har brugt danske data med naturlige eksperimenter til at kigge på gamle problemer med nye, friske øjne:

»Der er særligt i politisk økonomi og blandt politologer en overvægt i retning af amerikanske data, og nogle gange kan man komme nemmere afsted med ting, hvis man har amerikanske data. At vi har kunnet sælge forskningsresultater med danske data til de bedste amerikanske tidsskrifter, det er jeg sgu stolt af.«

Forbløffet blev David Dreyer Lassen den dag i december, da der tikkede en mail ind i december fra uddannelses- og forskningsministeren. Han var en af årets fem modtagere af EliteForsk-prisen på 1,2 millioner kroner, stod der.

»Man er jo ikke informeret om, at man er i betragtning. Når man søger penge, har man selv lavet et stort stykke arbejde, og man går og venter på et svar. Her kom pengene helt ud af det blå.«

Selv om David Dreyer Lassen har haft succes med at lande eksterne bevillinger – blandt andet 11 millioner kroner fra det europæiske forskningsråd, ERC, til at forske i hvordan menneskers utålmodighed og risikovillighed påvirker deres holdning til økonomisk politik – falder denne million på et tørt sted:

»Det er ingen hemmelighed, at den økonomiske situation betyder, at der ikke p.t. er super mange penge i systemet, og det bliver sværere at finde stillinger til yngre forskere. De her penge bliver rigtig gode til projekter, der kræver ekstra opmærksomhed.«

Den personlige hæderspris på 200.000 kroner, der er et ekstra krydderi til prisen, skal bruges med familien:

»Forskning er en tidskrævende affære. Jeg kan ikke huske, hvornår familien sidst har været på en rejse, der ikke var planlagt rundt om en konference, jeg skulle til.«

Læs om David Dreyer Lassens nye center her.

gbg@adm.ku.dk

Seneste