Temanummer om data i Science

Special issue af tidsskriftet Science fra den 11. februar (2011, 331 [6018], s.639-806) hedder “Dealing with Data” og handler om videnskabelig data og tilknyttede emner i bred forstand.
Man kan bl.a. læse om hvordan partikelfysikere kan lære noget af genetableringen af deres gamle data: Data har en tendens til at forsvinde, når fysikerne anskaffer nyt og bedre hardware. I artiklen ”Is There an Astronomer in the House?” præsenteres et eksempel på samarbejde mellem meget forskellige forskningsområder; det viser sig, at er biomedicinere og astronomer kan hjælpe hinanden med at løse dataproblemer inden for hhv. stjerner og kræftforskning. Og under overskriften “May the Best Analyst Win”, kan man læse om et firma, Kaggle, der udnytter crowdsourcing til at køre konkurrencer, hvor offentligheden analyserer fx forskningsdata.
Temanummeret behandler så forskellige forskningsområder som klimaforskning og –økologi, til samfundsvidenskab og celler. Emnerne tæller bl.a. data-visualisering, Open Data, data-deling og –behandling, samt rettigheder – og manglende rettigheder til data.
Science har foretaget en undersøgelse blandt sine peer-reviewers, om deres brug af data. Her et par udpluk: 56 % anvender sjældent data fra litteraturen eller arkiver – resten gør det ofte eller ind i mellem. Langt de fleste har bedt kollegaer om data. Halvdelen bruger data, der fylder under én Gigabyte og en tredjedel har data, der fylder ml. 1-100 Gigabyte. Det meste data lagres lokalt, og kompetencerne til at arbejde med data er også lokale. Overraskende nok angiver 38 % af forskerne, at de opbevarer deres data ”permanent”.
I takten med at mængden af data stiger (the Data Deluge, fx Baraniuk, ibid), genereres og opstår store mængder af viden-om-viden (jf. Metaknowledge, Evans & Foster, ibid): Heldigvis er der mønster i kaos og hints om at dette kan medvirke til at udvikle videnskaben og dets metoder.
Indtrykket er at området bærer præg af et behov for understøttende infrastruktur, standarter og generel viden, der bl.a. kan være med til at forhindre ressourcespild, sikre langtidsadgang til data, videnskabelig kvalitet, samt synergieffekter på tværs af traditionelle fagskel.

{jcomments on}