Deling af data – Københavns Universitet

Forside > Forskning > Datamanagement > Deling af data

Deling af data

Dine forskningsdata har stor værdi for dig. Du kan gøre det nemmere for andre forskere at referere til din forskning eller at bruge dine forskningsdata ved, at du deler dine data med andre.

Der er en række aspekter, du bør overveje, når du deler dine data, det kan du se mere om herunder.

Etiske aspekter

Når du vælger, hvordan du opbevarer, deler og eventuelt publicerer data, er det vigtigt, at du er opmærksom på de etiske aspekter.

Når forskning involverer mennesker som deltagere, er det vigtigt, at det sker med respekt for individets værdighed, rettigheder og velfærd og på en måde, som minimerer risici for deltagerne, forskerne, tredjeparter og fakultetet.

Personfølsomme data i forskningsprojekter skal registreres af fakultetet. Kontakt Forskerservice.

Personfølsomme data skal opbevares på en særlig sikker måde, læs om opbevaring af data.

Fakultetets Forskningsetiske Komité rådgiver om etiske aspekter og har udarbejdet retningslinjer, der kan ses på komitéens hjemmeside. Den etiske komité fungerer bl.a. som Institutional Review Board (IRB) i de tilfælde, hvor du i en ansøgning skal dokumentere, at institutionen har godkendt de etiske aspekter af din ansøgning.

Anonymisér dine personfølsomme data før publicering

Normalt er det nødvendigt at anonymisere personfølsomme data, inden de publiceres. Anonymisering betyder, at information, der gør det muligt at identificere individer fjernes. Det skal sikre, at individet også er anonymt efter en evt. samkøring med andre dataset. 

Pseudonymisering er ikke anonymisering! Begrebet pseudonymisering dækker over, at der alle steder i data refereres til en person vha. et pseudonym fx et nummer eller en kode. Pseudonymisering kan være et tiltag for at implementere passende sikkerhedsforanstaltninger imod adgang til personoplysninger. Et sådant tiltag kan være relevant for behandling af data med høj risiko, fx behandling af følsomme oplysninger i større omfang.

FAIR data

FAIR-principperne (Findable, Accessible, Interoperable, Reusable) blev defineret i 2016 og fokuserer på EU’s ønske om større deling og genbrug af forskningsdata. De fire principper kan overordnet uddybes sådan:

  • Findable: Forskningsdata skal kunne findes af andre forskere, data skal have tilknyttet metadata, og data skal være tildelt en unik og konsistent identifikator, en Persistent Identifier (PID) for at kunne genfindes og for, at man kan referere til data på en konsistent måde.
  • Accessible: Data og deres metadata skal være forståelige for mennesker og computere. De bør være tilgængelige på en velbeskrevet måde, fx ved at de lægges i et anerkendt datalager. Licensbetingelserne for data bør være afklaret, og de bør være så åbne som muligt.
  • Interoperable: Data gøres så genanvendelige som muligt, fx ved at benytte anerkendte standarder for dataformater, ved at bruge åbne filformater for data eller dele data vha. en standardiseret kommunikationsprotokol. Man kan benytte anerkendte metoder for dataindsamling og anerkendte ontologier i beskrivelsen af data.
  • Reusable: Datas proveniens er beskrevet, så det er klart, hvordan data er indsamlet og bearbejdet.  Licensbetingelserne bør gøre det muligt at genbruge data evt. efter en rimelig embargo-periode. Det er også vigtigt, at datas kvalitetsstandarder er beskrevet.

Man bør tilstræbe, at de generede forskningsdata er så FAIR som muligt: ”as open as possible, as closed as nessesary”.

Læs mere

Når du vil dele dine data

De forskningsdata, du vil dele med forskere uden for universitet, bør du lægge i et godkendt datalager, som tilbyder, at dine data får en unik og konsistent identifikator, en såkaldt Persistent Identifier (PID), så det er nemt at referere til dine data fra fx dine publikationer. 

Overvej, i hvilket datalager du lægger dine data. KU tilbyder et generelt datalager med tildeling af en PID til dit datasæt. Hvis dit forskningsmiljø/fagområde eller dine samarbejdspartnere benytter et andet datalager, så kan det give dine data større synlighed, hvis de placeres i et fagspecifikt datalager.

Overvej, hvilke garantier for opbevaring, varighed og licensforhold de enkelte datalagre tilbyder, når du vælger, hvor du placerer dine data.

Metadata

Dine data skal have en metadatabeskrivelse, når du vil dele dem. Det enkelte datalager sætter rammen for, hvilke metadata der kan tilknyttes data.

Eksempler på datalagre

Listen udvides løbende, kontakt forskerservice@hum.ku.dk, hvis du har forslag og spørgsmål.

Ejerskab og licenser

Ejerskabet for forskningsdata bør aftales, når et forskningsprojekt starter. Ejerskabet påvirker IPR-rettighederne, hvor data kan opbevares, og hvordan data kan publiceres og deles. Ejerskabet kan være uklart, hvis projektet involverer:

  • Både forskere og studerende
  • Krav fra bevillingsgivere
  • Eksterne parter
  • Samarbejde med eller bevillinger fra kommercielle partnere

På KU arbejdes der under følgende generelle regler:

  • Forskningsdata produceret, mens man er ansat på KU, tilhører KU, men KU giver forskeren en royalty-fri, ikke-eksklusiv ret til at bruge data til forsknings- og undervisningsformål. Det betyder, at man kan få en kopi af sine data med sig, hvis man ikke længere arbejder på KU.
  • Forskningsdata produceret som studerende på KU tilhører den studerende.

Licenser

Når du publicerer dine data eller deler dem med partnere uden for KU, skal du tilknytte en licens. Hvis ikke samarbejdsaftaler eller forpligtelser fra fx bevillingsgiver taler imod det, så vælg så åben en licens som muligt. En mulighed er at bruge Creative Commons Attribution Non-Commercial Share Alike License 4.0 CC BY-NC-SA.

  • Attribution (BY):  Kreditering
  • NonCommercial(NC): IkkeKommerciel
  • ShareAlike(SA): Del på samme vilkår

Identifikation af data: PID

Når du vil publicere dine data, så er det god praksis først at tilknytte en unik og konsistent identifikator, en såkaldt Persistent Identifier (PID) til dine data. En PID bruges til at identificere et digitalt objekt, fx et dokument eller en datafil, og fungerer ved at indeholde et link til det sted eller system, hvor dine data ligger lige nu.

PID’en tildeles først, når data er i en form, der skal publiceres, og hvor data derfor skal bevares uændret. Dette kan være relevant, når du publicerer en artikel og vil referere til dine data i artiklen, eller fordi bevillingsgiver kræver, at de endelige data stilles til rådighed for andre.

PID’en er en registrering af, hvor dine data pt. ligger, og en PID kan sikre, at alle ved at adressere PID’en finder hen til det sted, dine data faktisk befinder sig. Hvis du senere flytter dine data, eller de kommer til at ligge under en anden url, så kan man i den anvendte PID-service registrere, at der nu skal peges på en anden destination – en anden url.

Der er forskellige systemer, der håndterer PID’s, fx handle.net, EPIC, DOI, DataCite. Det datarepositorium, som du vælger til at publicere dine data, vil normalt også tilknytte en PID til dine data.

DataCite

DataCite er en måde at registrere en persistent ID (PID) til dine data. KU–IT arbejder på et system, som gør det let at rekvirere en PID via DataCite og arkivere data på en varig måde i samme arbejdsgang.

DOI

Digital Object Identifier (DOI) er en måde at give dine data en persistent ID (PID). DOI kan være et godt valg, hvis dine samarbejdspartnere bruger DOI. Bemærk, at KU tilbyder et system, der tildeler en DataCite PID til dine data.

ORCID

Open Researcher and Contributor ID (ORCID) blev lanceret i 2012 og er en varig ID-kode, der kan tildeles forskere.

ORCID er en unik kode, som forskere kan oprette, sådan at de kan identificeres entydigt ved navneskift, institutionsskift, navnesammenfald eller ved forskellige tilgange til at forkorte fornavne. ORCID håndterer, at personnavne ofte ikke er unikke og kan variere over tid. Med en ORCID bliver det nemmere at finde alle publikationer fra en bestemt forsker.

Som forsker på KU kan du registrere din ORCID i CURIS. Dine publikationer høstes bl.a. til den danske forskningsdatabase, hvor det er muligt at søge efter alle publikationer fra en bestemt forsker vha. navn eller ORCID.