Odprta znanost vključuje odprto deljenje vseh rezultatov raziskovalnega dela, vključno z raziskovalnimi podatki.
Eden glavnih argumentov za odprto oz. javno deljenje rezultatov raziskovalnega dela je dejstvo, da je velik delež znanstvenih raziskav financiran iz javnih sredstev.
1 Politike odprtega dostopa v Sloveniji | 2 Kaj so raziskovalni podatki? | 3 Kako poteka proces upravljanja z raziskovalnimi podatki? | 4 Izdelava načrta in vprašanja | 5 Zbiranje in analiza raziskovalnih podatkov | 6 Priprava raziskovalnih podatkov za ponovno uporabo | 7 Deljenje in objava raziskovalnih podatkov | 8 Datoteke | 9 Datotečni formati | 10 Hramba raziskovalnih podatkov | 11 Repozitoriji | Koristne povezave
Eden glavnih argumentov za odprto oz. javno deljenje rezultatov raziskovalnega dela je dejstvo, da je velik delež znanstvenih raziskav financiran iz javnih sredstev.
1 Politike odprtega dostopa v Sloveniji | 2 Kaj so raziskovalni podatki? | 3 Kako poteka proces upravljanja z raziskovalnimi podatki? | 4 Izdelava načrta in vprašanja | 5 Zbiranje in analiza raziskovalnih podatkov | 6 Priprava raziskovalnih podatkov za ponovno uporabo | 7 Deljenje in objava raziskovalnih podatkov | 8 Datoteke | 9 Datotečni formati | 10 Hramba raziskovalnih podatkov | 11 Repozitoriji | Koristne povezave
Vse, kar je bilo uporabljeno ali ustvarjeno med raziskovalnim procesom in podpira oz. potrjuje izsledke raziskave. Običajno nastopajo v obliki zbirke datotek, ki nastanejo med raziskovalnim projektom / raziskavo (preglednice, dokumenti, slike, videi ali avdiodatoteke idr.); lahko pa se pojavijo tudi v ne-digitalni obliki (laboratorijski zvezki, dnevniki idr.).
|
V načrtu je opredeljeno:
- Kateri podatki se bodo zbirali ali ustvarjali?
- Kako se bodo podatki zbirali ali ustvarjali?
- Katera dokumentacija in metapodatki bodo priloženi podatkom?
- Kako boste poskrbeli za etično in pravno skladnost?
- Kako boste reševali vprašanja avtorskih pravic in pravic intelektualne lastnine?
- Kako se bodo podatki med raziskavo hranili in varnostno kopirali?
- Kako boste upravljali dostop in varnost podatkov?
- Kakšen je dolgoročni načrt hranjenja nabora podatkov?
- Kako boste delili podatke?
- Kdo bo odgovoren za upravljanje podatkov?
- Kakšna sredstva boste potrebovali za izvedbo svojega načrta?
- in zagotavlja, da načrt ravnanja upošteva zahteve raziskovalnega področja in krovnih ter institucionalnih politik.
Pri zbiranju in analizi RP moramo upoštevati naslednje značilnosti:
- različni pristopi (kvalitativni, kvantitativni);
- različen obseg datotek;
- različno financiranje (javno, komercialno);
- različne omejitve (upoštevanje etičnih, pravnih in pogodbenih omejitev);
- osebni in občutljivi podatki morajo biti zaščiteni;
- zaščita avtorskih pravic: RP morajo biti zaščiteni pred nepooblaščeno uporabo.
Podatki morajo biti opisani z izčrpnimi metapodatki, ki ustrezajo standardom relevantnega področja in ki vključujejo trajne identifikatorje, podprte s standardiziranim komunikacijskim protokolom (metapodatki so dostopni tudi, ko podatki niso več na voljo). Omogočajo tudi citiranje in so strojno berljivi (npr: trajni identifikator DOI, datum objave, naslov, avtor, opis, ključne besede, licenca itd.).
Uporabijo se lahko:
Uporabijo se lahko:
- splošni metapodatkovni standardi (npr. Dublin Core)
- ali domensko specifični (npr. DDI)
Dodatna dokumentacija uporabnikom naših podatkov pomaga pri razumevanju in ponovni uporabi podatkov.
Primeri dodatne dokumentacije:
Primeri dodatne dokumentacije:
- laboratorijski dnevniki in opisi protokolov
- vprašalniki
- šifranti, definicije spremenljivk, podatkovni slovarji
- merske enote
- ontologije, kontrolirani slovarji
- sintakse programskega jezika in izhodne datoteke programske opreme
- informacije o nastavitvah opreme in kalibraciji instrumenta
- shema baze podatkov, opis strukture direktorija datotek, struktura poimenovanj
- poročila o metodologiji
- informacije o analizi in postopkih
- informacije o izvoru pridobljenih ali digitaliziranih podatkov
- programska koda – razmislek ali jo je potrebno hraniti za reproducibilnost podatkov?
• Podatkom in metapodatkom je treba dodeliti ustrezno licenco (praviloma pri ravnanju z raziskovalnimi podatki uporabljamo odprte licence, kot so npr. licence Creative Commons).
• Podatkom praviloma dodelimo licenco CC BY, metapodatkom pa CC0.
• Uporaba po meri ustvarjenih licenc za licenciranje odprtih raziskovalnih podatkov in metapodatkov je odsvetovana.
• Večina repozitorijev že daje na voljo privzete oblike citatov v enem ali več citatnih slogih.
• Če boste svoje podatke odložili v repozitorij, ki ne ponuja citatnega sloga, ki ga potrebujete, si lahko pri citiranju pomagate s spletno stranjo Cite This for Me.
Raziskovalne podatke je mogoče v skladu s Tipologijo dokumentov/del za vodenje bibliografij v sistemu COBISS vpisati pod rubriko 2.20 Zaključena znanstvena zbirka raziskovalnih podatkov.
Raziskovalne podatke moramo pred deljenjem primerno oblikovati, da jih bodo drugi raziskovalci lahko razumeli in ponovno uporabili. Raziskovalni podatki bodo v repozitorijih objavljeni brez spremljevalnega konteksta, zato je potrebno toliko več pozornosti posvetiti primernemu poimenovanju datotek, hierarhiji datotečnih map ter metapodatkom (ki so lahko opisani v datotekah PreberiMe ali v podatkovnih člankih). Pozorni moramo biti tudi na datotečne formate, saj so za ponovno deljenje primerni le nekateri.
- poimenovanje datotek naj bo konsistentno,
- imena datotek naj bodo kratka (idealno <25 znakov, vsekakor pa <40),
- izogibajte se uporabi presledkov, pik, poševnic in posebnih znakov (npr. & in %),
- za izboljšanje berljivosti in ločevanje posameznih elementov imena uporabljajte velike začetnice, podčrtaje in vezaje,
- datume zapišite v formatu ISO 8601: LLLLMMDD (L = leto, M = mesec, D = dan),
- v ime vključite različico datoteke,
- zaporedje elementov imena naj bo takšno, da je datoteke mogoče sortirati po datumu nastanka, zaporedni oznaki ali različici.
- datum nastanka datoteke (če zapišete datum na začetku imena, bo to olajšalo sortiranje datotek),
- ime ali številka projekta,
- ime avtorja/-ice,
- kratek opis vsebine datoteke,
- številka vzorca,
- tip analize,
- različica datoteke.
Sortiranje datotek po mapah ter organizacija map v hierarhično oz. drevesno strukturo pomagata k boljši preglednosti vsebine. Priporočljivo je, da hierarhija nima več kot štirih nivojev in naj vsaka mapa ne vsebuje več kot 10 datotek. Posamezni nivoji naj odražajo najbolj smiselno klasifikacijo datotek, npr. po eksperimentih, datumih, lokacijah, tipih analiz, tipih datotek …
- 9.1 Besedilo
- 9.2 Številski podatki (tabele)
- 9.3 Statistične analize in grafi
- 9.4 Fotografije in drugo slikovno gradivo
- 9.5 Videodatoteke
- 9.6 Avdiodatoteke
- 9.7 Računalniška koda
- rtf (Rich Text Format),
- .pdf (PDF/UA, PDF/A ali PDF),
- .htm (HTML),
- .odt (OpenDocument Text),
- .rmd (datoteke R Markdown, tudi v obliki HTML)
- .txt (neoblikovano besedilo),
- pogosto uporabljeni formati: .doc/.docx (Microsoft Word), .xls/.xlsx (Microsoft Excel),
- .xml (XML označevalno besedilo v skladu s primerno definicijo tipa dokumenta (document type definition, DTD) ali shemo, npr. XHMTL 1.0).
- csv (comma-separated values oz. vrednosti, ločene z vejico),
- .tab (tab-delimited file oz. datoteka, razmejena s tabulatorji),
- razmejeno besedilo z definicijskimi trditvami o podatkih v jeziku SQL.
- .txt (besedilo, razmejeno z znaki, ki niso del podatkov)
- pogosto uporabljeni formati: Microsoft Excel (.xls/.xlsx), Microsoft Access (.mdb/.accdb), dBase (.dbf), preglednice v formatu OpenDocument (.ods).
- lastniški formati programske opreme za statistično obdelavo podatkov, npr. .sav (SPSS), .dta (Stata), .sas7bdat (SAS) itd.
- datoteke z razmejenim tekstom in ukazi (“setup”) programov SPSS, Stata, SAS itd.
- strukturirano besedilo ali strukturirane metapodatkovne oznake, npr. v formatu DDI XML. Sprejemljiva formata sta tudi .por (SPSS prenosni format) in .mdb/.accdb (Microsoft Access).
- za grafe, ki jih izvozite kot slike, veljajo enaka pravila glede datotečnih formatov kot za fotografije.
- tif (nestisnjen TIFF 6.0),
- .dcm, .dcm30 (Digital Imaging and Communications in Medicine – DICOM) za podatke računalniške tomografije (CT) in magnetne resonance (MRI),
- JPEG (.jpeg, .jpg), če je bil v tem formatu ustvarjen izvirnik,
- BMP (.bmp), če je bil v tem formatu ustvarjen izvirnik,
- PNG (.png), če je bil v tem formatu ustvarjen izvirnik,
- drugi tipi formata TIFF (.tif, .tiff),
- slikovni format RAW (.raw),
- datoteke programa Photoshop (.psd),
- Adobe Portable Document Format – PDF/A, PDF (.pdf).
- mp4 (MPEG-4),
- .ogv, .ogg (OGG video),
- .mj2 (motion JPEG 2000).
- .mov (MOV),
- .wmv (Windows Media Video),
- .webm (WebM).
Priporočljivo je, da zvok delite v formatu .flac (Free Lossless Audio Codec). Sprejemljivi formati so še:
- .mp3 (MPEG-1 Audio Layer 3), če je bil v tem formatu ustvarjen izvirnik,
- .aif (Audio Interchange File Format),
- .wav (Waveform Audio Format).
Splošna priporočila navajajo, da je računalniško kodo najbolje naložiti v namenski spletni repozitorij, ki bo zagotovil nadzor različic, pregled kode, odkrivanje hroščev, dokumentacijo, podporo uporabnikom in druge zmogljivosti. Med najbolj priljubljenimi repozitoriji so GitHub, Bitbucket in GitLab. Različice kode, ki podpirajo raziskovalne rezultate, naj se izvozijo iz repozitorija in arhivirajo v zaupanja vrednem javnem podatkovnem repozitoriju. S tem bo specifični različici kode, s katero so bili ustvarjeni ali analizirani raziskovalni podatki, pripisan DOI, po katerem jo bo mogoče citirati. GitHub npr. že omogoča enostavno funkcijo za arhiviranje računalniške kode v repozitoriju Zenodo. Arhivirano kodo je priporočljivo opremiti tudi z odprtimi licencami, s katerimi postavite pogoje ponovne uporabe.
Naraščajoč obseg in razpoložljivost spletnih virov zahtevata, da so raziskovalni podatki že od nastanka namenjeni dolgotrajnosti. S tem namenom so leta 2016 izšla načela FAIR za upravljanje raziskovalnih podatkov The FAIR Guiding Principles for scientific data management and stewardship:
- Findability (najdljivost): strojno berljivi zapisi, unikatni trajni identifikatorji (DOI, PID, URN..) objava v viru, kjer je omogočeno iskanje.
- Accesibility (dostopnost): enostavna avtentikacija in avtorizacija, jasni protokoli za poizvedovanje ali kopiranje podatkov.
- Interoperability (interoperabilnost): podatki so strojno berljivi, vključujejo metapodatke in podatke, standardizirane slovarje / geslovnike in so povezani z drugimi viri.
- Reusability (ponovna uporaba): podatki so dobro predstavljeni in tako uporabni za nove raziskave (dobro predstavljen izvor, provenienca).
Raziskovalni podatki morajo biti objavljeni v zaupanja vrednem repozitoriju, relevantnem za področje raziskave. Zaupanja vredni repozitoriji:
V Sloveniji trenutno delujeta dva področno specifična repozitorija:
Najbolj uveljavljeni splošni repozitoriji so:
- priporočeni repozitoriji z oznako CORE TRUST SEAL (pri nas Arhiv družboslovnih podatkov),
- iskalnik zaupanja vrednih repozitorijev za RP (re3data.org).
- so prva izbira za vaše podatke, če na vašem raziskovalnem področju obstajajo;
- zagotovitev, da bodo vaši podatki hranjeni med sorodnimi podatki drugih raziskovalcev in tako lažje najdljivi;
- zaradi dobro uveljavljenih kriterijev poročanja o procesu raziskav tudi RP kar najbolj ponovno uporabni za druge zainteresirane osebe.
V Sloveniji trenutno delujeta dva področno specifična repozitorija:
- Arhiv družboslovnih podatkov (osredotoča se na podatke, povezane s slovensko družbo ali sicer pomembne za slovensko družbo in družboslovje ne glede na geografske meje)
- in CLARIN.SI, slovensko vozlišče mednarodne mreže jezikoslovnih repozitorijev.
Služijo raziskovalnim organizacijam, ki so jih ustanovile. Večina slovenskih institucionalnih repozitorijev je bila ustanovljena z namenom digitalizacije univerzitetnih zaključnih del, ki se ji je kasneje pridružila hramba odprto dostopnih različic znanstvenih publikacij, v zadnjem času pa se vzpostavlja tudi infrastruktura za hrambo raziskovalnih podatkov. Slovenski institucionalni repozitoriji so:
- Repozitorij Univerze v Ljubljani (RUL),
- Digitalna knjižnica Univerze v Mariboru (DKUM),
- Repozitorij Univerze na Primorskem (RUP),
- Repozitorij Univerze v Novi Gorici (RUNG),
- Repozitorij samostojnih visokošolskih in višješolskih izobraževalnih organizacij (ReVIS)
- Digitalni repozitorij raziskovalnih organizacij Slovenije (DiRROS).
- Lahko jih uporabite, če na vašem raziskovalnem področju primeren področno specifični repozitorij ne obstaja, institucionalni repozitoriji pa ne ustrezajo vašim potrebam.
- Sprejemajo raziskovalne podatke ne glede na tip podatkov, datotečni format, vsebino raziskave ali raziskovalno področje.
- Načeloma ne predpisujejo standardnih metapodatkovnih shem za opis provenience podatkov, zato je pomembno, da prostovoljno upoštevate področno specifične kriterije za opis eksperimentalnega procesa, ki jih k podatkom priložite v obliki datoteke PreberiMe.
Najbolj uveljavljeni splošni repozitoriji so:
- Zenodo – upravlja ga CERN,
- Figshare – upravlja ga britansko tehnološko podjetje Digital Science,
- Dryad – upravlja ga istoimenska neprofitna organizacija,
- Harvard Dataverse – upravlja ga Univerza Harvard,
- Mendeley Data – upravlja ga znanstvena založba Elsevier,
- OSF – upravlja ga ameriški Center for Open Science.
Managing and sharing research data : a guide to good practice (Corti Louise, Van den Eynden Veerle, Bishop Libby, Woollard Matthew, 2014)
Postavitev: 001 MANAGING and sharing
Priprava raziskovalnih podatkov za odprti dostop: priročnik za raziskovalce (Štebe Janez, Bezjak Sonja, Vipavc Brvar Irena, 2015)
E - dostop
- DIRROS DATA portal
- ODPRTA KNJIŽNICA – RAZISKOVALNI PODATKI
- Iskalnik zaupanja vrednih repozitorijev za RP (re3data.org)
- Orodji za načrtovanje dela z RP (FAIR Assesment Tool, Fair Aware)
- Značilnosti odgovornega ravnanja z raziskovalnimi podatki (mag. M. Pušnik)
- Nacionalna strategija odprtega dostopa do znanstvenih objav in raziskovalnih podatkov v Sloveniji 2015−2020
- Resolucija o znanstvenoraziskovalni in inovacijski strategiji Slovenije 2030 (ReZrIS30) (člen 6.2.)
- Zakon o znanstvenoraziskovalni in inovacijski dejavnosti (ZZrID)(41. člen)
- Pravilnik o doktorskem študiju Univerze v Ljubljani (50. člen)
- Unescova priporočila o odprti znanosti
- Unescov sklop orodij za odprto znanost