Metadata og ontologier

Metadata for forskningsdata er informasjon som gj?r det mulig ? finne og forst? hvem, hvor og hva dataene stammer fra.

Metadata skal v?re lesbare for b?de maskiner og mennesker. Standardiserte metadata er helt sentralt for ? gj?re data gjenfinnbare, tilgjengelige, interoperable og gjenbrukbare (FAIR).

Metadata kan v?re aktuelt p? flere niv?er. P? datasettniv? er det alltid aktuelt, mens det avhengig av fagfelt vil v?re ulike behov for metadata p? filniv?.

Standardiserte metadata

Det finnes generelle og fagspesifikke metadatastandarder for forskningsdata, men for de fleste vil det ikke finnes en standard som passer akkurat til de dataene du skal beskrive. Metadata legges helst i standardiserte felter som gj?r utveksling av informasjonen, for eksempel mellom s?kel?sninger, mulig. 

Ulike arkiv for forskingsdata bruker ulike og noe tilpassede standarder. Valget av arkiv vil derfor oftest legge f?ringer for hvilke metadatastandard du skal anvende.

Sikt arkiv (tidligere NSD) bruker metadatastandarden ?Data Documentation Initiative? (DDI) som er tilpasset samfunnsvitenskapene og sp?rreskjemadata. DDI utvikles og vedlikeholdes i nettverket av tilsvarende arkiver.

DataverseNO anvender Dataverse sin blokk-baserte metadatatilpasning, som vektlegger utveksling gjennom eksport (JSON og XML) og mapping til de mest anvendte standardene (DDI, DublinCore, DataCite ect.) og samtidig tar inn enkelte fagspesifikke felter. Standarden er utviklet for forskningsdata og er generisk, men jobber stadig med videre tilpasning for ulike fagfelt ved utvikling av metadata blokker. Denne standarden brukes i de mange Dataverse-arkivene som finnes globalt og ligger ogs? til grunn for IT-avdelingens metadataverkt?y.

Skal du lage en egen metadatastandard?

Det er ekstremt ressurskrevende et forskningsmilj? ? ta p? seg ? utvikle, implementer og vedlikeholde en ny standard. Fordelen ved ? bruke en eksisterende standard er s? stor at det i de aller fleste tilfeller er fornuftig ? anvende en generisk standard for metadata til forskningsdata heller enn ? vurdere egen tilpasning.

Ontologier eller vokabularer

Ved ? bruke kontrollerte vokabularer i beskrivelser av data, s?kalte ontologier, kan du vise til riktig forst?else av et begrep. Dette kan v?re aktuelt p? datasettniv?, men er f?rst og fremst interessant p? datapunkt niv? i filer og ? presist identifisere ulike faktorer. 
Bruk av ontologier ned p? variabel niv?, muliggj?r identifisering av fellesnevnere p? tvers av et st?rre datamateriale.

Ontologier og URI-er brukes for ? lage lenkede ?pne data. Dette har store fordeler om man har store mengder standardiserte data og/eller ?nsker ? kombinere data fra ulike kilder. 

Eksempler p? fag hvor ontologier brukes p? denne m?ten er:

Emneord i metadata

P? datasett niv? kan n?kkelord gj?res interoperable, ved at du tar i bruk kontrollerte emneord i beskrivelsen av datasettet. Det finnes mange ulike vokabularer:

  • OLS ontology search 
  • Mesh innenfor medisin og helsefag
  • Agrovoc innenfor landbruk og planter
  • Humord ¨C en norsk tesaurus for humaniora og samfunnsvitenskap med tilgrensende fagomr?der, driftet av Universitetsbiblioteket.

 

Å·ÖÞ±­ÔÚÏßÂòÇò_Å·ÖÞ±­Í¶×¢ÍøÕ¾ÍƼö@sdata: Tematisk oversikt

Hovedside for forskningsdatah?ndtering

Publisert 2. juli 2024 09:21 - Sist endret 8. juli 2024 09:18