Jak udostępniać dane badawcze


Po znacznym już upowszechnieniu publikowania otwartego, czyli tzw. publikacji Open Access, nadchodzi czas otwartego publikowania danych badawczych.

Obowiązujące dziś przepisy ministerialne wciąż są w kategorii zaleceń, ale większość badaczy już spotkała się z wymogiem udostępniania danych badawczych przy aplikowaniu o granty – chociażby z Narodowego Centrum Nauki. Jeden z grantowych dokumentów to Plan Zarządzania Danymi Badawczymi (Data Management Plan – DMP). Bywa on – niesłusznie – traktowany jako kolejny przejaw biurokracji, a może stać się szalenie przydatnym narzędziem dla naukowca. Dzięki niemu w pracy badawczej można wiele rzeczy uporządkować. Jednym z pytań DMP jest to dotyczące wyboru miejsca oraz sposobu udostępnienia danych badawczych.


1. Repozytoria danych badawczych, czyli miejsca, gdzie dane badawcze wybrane przez autora do udostępnienia i przechowywania mogą być dostępne przez określony czas. Aby się tam mogły znaleźć, powinny spełnić kilka warunków, z których te podstawowe są dwa: dobre i logiczne ich opisanie (tzw. metadane) oraz przygotowanie w takiej formie, by potencjalny użytkownik mógł je łatwo odszukać i bezproblemowo otworzyć (zgodnie z zasadami FAIR).

Które repozytorium będzie najlepsze dla moich danych badawczych?

Zasada pierwsza – wybór repozytorium dziedzinowego, prestiżowego i znanego w środowisku. Drugą możliwością jest repozytorium instytucjonalne (jednej uczelni czy placówki badawczej, bądź wspólne dla kilku uczelni). Trzeci wariant to repozytorium ogólne, dla różnych dyscyplin. W Polsce taką rolę pełni RepOD (Repozytorium Danych Badawczych) – związane z ICM, lecz coraz liczniejsze są osadzone tam tzw. kolekcje instytucjonalne (jednej uczelni lub placówki badawczej). Najbardziej znane repozytorium ogólne to Zenodo, ale lista repozytoriów wciąż się wydłuża. W poszukiwaniu najtrafniejszego wyboru może pomóc baza re3data. Można tam szukać zarówno terytorialnie, jak i dziedzinowo.

Bardzo pomocne mogą być także wykazy repozytoriów rekomendowanych przez poszczególnych wydawców. Takie informacje zamieszcza np. SpringerElsevierMDPICambridge University Press czy PLOS One.

2. Supplementary data – dane badawcze dołączone jako tzw. supplementary material do manuskryptu przesyłanego do wydawcy. Przesyłane jako oddzielny plik, ale – to warunek konieczny – równocześnie z tekstem publikacji, ponieważ one także będą podlegać ocenie recenzenta. Każdy wydawca ustala reguły ich publikacji, zazwyczaj można je znaleźć w sekcji informacji dla autorów. Przykładowo: IOP ScienceSpringerPLOS One.

Supplementary data mogą być także udostępniane w formie linku na stronie domowej autora.

3. Data journals – czasopisma, w których nie są publikowane artykuły (czyli wyniki badań), a tylko tzw. data desciptor czy data papers. Zawierają opis zastosowanej metodologii badawczej, w jaki sposób i dlaczego powstały dane badawcze, oraz wyszczególnienie tego, co się znajduje w zdeponowanym datasecie. Warunkiem skorzystania z tej drogi jest wcześniejsze umieszczenie datasetu w jakimkolwiek repozytorium danych badawczych. Publikacje w data journals są także indeksowane przez Web of Science i są na liście ministerialnej (np. „Scientific Data”, „Data in Brief”, „Geoscience Data Journal” i inne).