Publicera dina covid-19-forskningsdata för att göra dem tillgängliga för resten av forskarsamhället. Data bör lagras i en öppen databas tillsammans med beskrivande metadata. För många datatyper finns internationalla databaser som kan anses vara de facto standarder.
Dela data
SciLifeLab (datacentre@scilifelab.se) eller NBIS (support@nbis.se) kan ge stöd och information för var och hur du kan dela dina data i publika databaser. Tveka inte att kontakta oss om du har några frågor. Din forskargrupp behöver inte vara ansluten till någon speciell institution för att få vår hjälp, vi är tillgängliga för alla forskare anslutna till svenska universitet och högskolor.
European Bioinformatics Institute (EBI) driver många olika internationella databaser som bör användas när så är lämpligt. Se vidare Covid-19 Data Portal data submission page. Om ditt datamaterial består av en datatyp som saknar en de facto databas, kan data istället deponeras i SciLifeLab Data Repository som drivs av SciLifeLab Data Centre. För känsliga persondata som måste lagras i en säker miljö med kontrollerad åtkomst kan SciLifeLab can help with publishing and access control.
Här följer riktlinjer för publicering av data uppdelat på datatyp:
-
Genomik & transkriptomik data
Vi föreslår att rådata och sammansatta sekvensdata skickas in till ENA. För vidare information om att publicera data på ENA se SARS-CoV-2 submission. Innan sekvensdata (t.ex. ”shot gun”-sekvenser) skickas in är det nödvändigt att ta bort humana (kontaminerande) sekvenser.
Humana värdsekvensdata kräver kontrollerad åtkomst, och NBIS utvecklar för närvarande en lokal version av European Genome-phenome Archive (EGA) i Sverige (EGA-SE) vilket kommer möjliggöra arkivering och delning av känsliga data inom en rättslig ram.
Tills dess att EGA-SE är tillgänglig, bör känsliga data fortsätta förvaras i en säker miljön (t.ex. på BIANCA på Uppmax). SciLifeLab kan hjälpa er med förfrågningar om åtkomst och publicering. Vi föreslår att ett meta-data post skapas i SciLifeLab Data Repository, med kontaktinformation för åtkomst, vilket genererar en permanent identifierare, en doi. DOI:n kan därefter användas i vetenskapliga publikationer för att hänvisa till dataseten. När den svenska EGA tagits i drift, och dataseten skickats in, kan åtkomstinformationen ändras för att hänvisa till EGA. Se till exempel DOI: 10.17044/NBIS/G000014.
- The European Nucleotide Archive (ENA)
- ENA SARS-CoV-2 submission guildelines
- SciLifeLab Data Repository for metadata records of sequence data with restricted access
-
Proteindata
Se FAIRsharing med sökterm ‘proteomics’ för en granskad lista över relevanta repositorier för proteomikdata. Uniprot är en av de viktigaste databaserna för proteinsekvenser. Proteinfamiljer lagras i Pfam och strukturer i PDBe.
Vi rekommenderar använding av repositoriet PRIDE, som tillhandahålls av ProteomeXchange Consortium. Repositoriet tar emot protein- och peptiddata, med tillhörande masspektra och övriga relaterade datatyper. Använd PRIDE repository and PX Submission Tool.
Andra typer av proteomikdata bör också göras tillgängliga genom datadelning, för detta rekommenderar vi använding av SciLifeLab Data Repository för andra typer av proteomikdata. För att data skall vara användbar för vidare analys och integrering rekommenderar vi en detaljerad beskrivning av data och variabler inkluderas. Varje protein skall ha en unik indentifierar som ett UniProt ID eller ENGS ID ( och ange vilken version som länken anges).
- PRIDE repository och PX Submission Tool
- SciLifeLab Data Repository for other types of proteomics data
-
Bilddata
Beroende på vilken typ av bilddata du har finns olika publika repositorier att välja bland, se BioImage Archive.
-
Kemisk biologi
Vi föreslår att kemisk biologi data skickas in till ChEMBL. ChEMBL är är en manuellt kurerad databas med bioaktiva molekyler med läkemedelsliknande egenskaper som drivs av EMBL-EBI. Databasen samlar kemiska och bioaktiva data samt genomikdata för att bidra till övergången från genomikdata till läkemedelsutveckling.
-
Hälsodata
Ifråga om hälsodata, där data inte kan deponeras i en publik databas på grund av sekretessbegränsningar, föreslår vi istället att en metadata-post skapas i SciLifeLab Data Repository. Denna skall innehålla information om vilken data som finns tillgängliga, var ten åtkomstbegäran skall skickas, hur en åtkomstbegäran kan göras och vad som krävs för åtkomst av känsliga hälsodata. The SciLifeLab Data Repository, som kureras och drivs av SciLifeLab Data Centre, gör det möjligt att få en permanent indentifierare för en meta-data post. Den permanenta identifieraren, doi, kan senare användas i exempelvis publikationer för att hänvisa till vart datatillgänglighet.
Stöd för datahanteringsplaner
För att effektivisera tillgängliggörande av data kan SciLifeLab och NBIS hjälpa dig med att planera din datahantering i början av projektet, både genom personliga konsultationer och genom att tillhandahålla ett anpassat verktyg för att skapa datahanteringsplaner. Vi kan också hjälpa dig att identifiera lämpliga repositorier och gemensamma internationella standarder för att beskriva och publicera dina data, samt vägleda dig genom publiceringsprocessen.
Deponera data i en publik databas
Genom att deponera data i en publik databas godkänner du att data publiceras under vissa villkor för användning, som du ibland kan bestämma själv, ibland specificeras av den databas där du väljer att lägga data. En publicering innebär oftast att du får en kod som unikt identifierar ditt dataset, och ofta krävs denna information av olika journaler för att ett manuskript ska accepteras för publicering.
Om så krävs, kan data förses med ett moratorium, dvs det blir inte publikt förrän vid ett visst datum som du bestämmer.
Observera att humandata kan behöva särskilda överväganden när det gäller publicering.
Lagra data hos ditt universitet eller SNIC
I Sverige gäller att rådata eller mätdata som genereras inom ett forskningsprojekt ägs av det lärosäte som har huvudmannaskap för projektet, medan resultat ägs av forskaren - det s.k. lärarundantaget. Råder inte sekretess eller skydd av personlig integritet för känsliga persondata, t.ex. biologiska mätdata från människa, så anses forskningsdata generellt vara allmän handling.
Lärosätet har ett juridiskt ansvar att arkivera data. Den datapublicering som vi stödjer i tjänsterna i denna portal ersätter inte detta ansvar. Därför bör du som forskare försäkra dig om att långtidslagra data genom de lösningar som ditt lärosäte tillhandahåller, och under den tid projektet är aktivt kan du få stöd för lagring och beräkning genom Swedish National Infrastructure for Computing, SNIC.