Iscriviti adesso

Dai dati isolati alla conoscenza condivisa: come WorldFAIR sta plasmando il futuro della ricerca

Gli scienziati spesso affrontano difficoltà nell'accesso e nell'utilizzo dei dati di ricerca a causa di una terminologia incoerente, formati non strutturati e dettagli mancanti. Il progetto WorldFAIR affronta questi problemi promuovendo i principi FAIR (Findable, Accessible, Interoperable, Reusable) per migliorare l'accessibilità dei dati e favorire la collaborazione tra discipline. Al centro del progetto ci sono 11 casi di studio che coprono un'ampia gamma di campi scientifici e comunità globali.

Gli strumenti digitali offrono opportunità sempre crescenti per la scienza collaborativa che affronta sfide globali, ma troppo spesso i dati preziosi necessari per informare tale lavoro restano fuori dalla portata dei ricercatori.

I dati potrebbero essere sepolti in una raccolta non ricercabile, codificati con una terminologia idiosincratica o in un modo che non può essere facilmente utilizzato con altri dati, oppure non essere immediatamente utilizzabili perché gli scienziati non possono verificare i dettagli sui dati stessi, come le loro origini o le condizioni di utilizzo.

“Questo è un problema che in realtà è vecchio quanto la scienza stessa”, spiega Simone Hodson, il direttore esecutivo della Comitato per i dati (CODATA) dell'International Science Council (ISC), che lavora per migliorare la disponibilità e l'usabilità dei dati.

Questi problemi di dati possono limitare le opportunità di ricerca e sprecare tempo e denaro. Secondo riparazioni pubblicato dalla Commissione Europea nel 2018, ripulire i dati di scarsa qualità per renderli utilizzabili è di gran lunga l'attività che richiede più tempo per un progetto medio di analisi dei dati e può ammontare all'80% dello sforzo totale.

Il Fiera mondiale progetto, una collaborazione tra CODATA e l'International Science Council (ISC), ha affrontato questo problema. Il progetto mirava a "far funzionare i dati" incoraggiando l'adozione di FIERA Principi dei dati (trovabili, accessibili, interoperabili, riutilizzabili), che promuovono una migliore gestione dei dati e una ricerca supportata dall'analisi assistita dalla macchina. 

Con la conclusione del progetto, CODATA intende continuare ed espandere l'iniziativa con FIERA Mondiale+, che includerà nuovi partner e casi di studio internazionali che metteranno in pratica le lezioni apprese nel corso del progetto biennale WorldFAIR. 

La nuova fase sarà strutturata come una "federazione" di progetti, fornendo un quadro di collaborazione in cui gli scienziati possono condividere competenze tecniche e basarsi sul lavoro reciproco. CODATA invita potenziali partner a suggerire casi di studio e a partecipare.

Casi di studio sull'interoperabilità dei dati

Il lavoro iniziale di CODATA che ha fornito la base per WorldFAIR è iniziato nel 2017, con il supporto dell'ISC e il finanziamento dell' Associazione cinese per la scienza e la tecnologia. Quel lavoro formativo includeva workshop che hanno portato allo sviluppo di tre casi di studio, ciascuno dei quali si è concentrato sull'uso dei dati in un campo specifico: malattie infettive, pianificazione urbana e riduzione del rischio di catastrofi. Nelle fasi iniziali del progetto, CODATA ha anche sviluppato una partnership chiave con la Data Documentation Initiative (DDI).

Sulla base di questi sforzi, CODATA si è assicurata finanziamento della Commissione Europea per WorldFAIR. Il progetto ha supportato 11 casi di studio che esaminano l'uso dei dati in un'ampia gamma di campi, tra cui patrimonio culturale, nanomateriali e scienze oceaniche. I casi di studio hanno interessato 13 paesi, tra cui Brasile, Kenya, Nuova Zelanda e Stati Uniti

Le lezioni apprese dal progetto hanno costituito la base di 11 raccomandazioni politiche per migliorare l'uso e la disponibilità dei dati per la scienza e ha portato allo sviluppo dell' Framework di interoperabilità tra domini (CDIF), che mira a rendere più interoperabili i dati provenienti da diversi campi scientifici. 

Allo stesso tempo, CODATA ha pubblicato nuovi Terminologia per la gestione dei dati di ricerca, che fornisce definizioni chiare dei termini utilizzati nel settore; tali termini sono stati ora pubblicati come un documento leggibile dalla macchina “Vocabolario FAIR”, e sarà presto disponibile online in un formato più facilmente leggibile. 

Ciascuno degli 11 casi di studio ha generato anche il proprio relazioni e linee guida per l'utilizzo dei dati, con l'obiettivo di formulare raccomandazioni pertinenti nei diversi ambiti della scienza. 

Uno dei casi di studio esaminati biodiversità agricola, concentrandosi sull'impollinazione, un campo in cui il modello per descrivere e categorizzare i dati è ancora in fase di definizione. Sulla base di dati e input da colleghi di tutto il mondo, ricercatori di mezza dozzina di paesi (Brasile, Kenya, Argentina, Stati Uniti, Regno Unito e Paesi Bassi) hanno sviluppato un guida completa e set di strumenti per dati relativi alle modalità di interazione tra piante e impollinatori. 

Si tratta di un argomento estremamente specifico, ma rilevante quasi ovunque, per scienziati di numerosi campi diversi, che ora possono trarre vantaggio da un modo unificato e standard di approcciarsi ai dati, rendendo più facile basarsi sul lavoro dei colleghi e accelerare la propria ricerca. 

“Passare da approcci diversi e iniziative isolate a dati FAIR ampiamente disponibili sulle interazioni tra piante e impollinazione per scienziati e decisori consentirà lo sviluppo di studi integrativi che migliorano la nostra comprensione della biologia, del comportamento, dell’ecologia, della fenologia e dell’evoluzione delle specie”, scrivono i ricercatori che hanno lavorato allo studio del caso

In un altro studio di caso, i ricercatori hanno esaminato riduzione del rischio di catastrofi“Dato che il cambiamento climatico e l’aumento della popolazione probabilmente aumenteranno sia la gravità che la frequenza dei disastri, la necessità di dati affidabili per informare le nostre risposte diventa sempre più critica”, scrivono. 

Gli scienziati e le agenzie nazionali e internazionali che lavorano sul rischio di catastrofi guardano al passato per stimare l'impatto di possibili eventi futuri e capire come mitigarli e riprendersi in seguito. Si basano anche sui dati che vengono costantemente sfornati da sensori sulla Terra e sui satelliti, gestiti da fonti pubbliche e private.

Ma nello studio del caso, i ricercatori hanno trovato difficile ottenere il tipo di informazioni necessarie per effettuare valutazioni accurate, perché molti dei dati rilevanti non si adattano ai principi dei dati FAIR. Spesso mancano informazioni vitali, come il numero di persone ferite in un disastro o la rapidità con cui si è svolto l'evento. In altri casi, le autorità nazionali utilizzano i propri metodi per calcolare i punti dati chiave senza mostrare il loro lavoro, rendendo difficile il confronto per gli altri.

Sulla base della loro ampia ricerca, il team dello studio di caso ha elaborato una serie di raccomandazioni per pratiche che dovrebbero semplificare l’adozione di decisioni politiche basate su prove in questo campo sempre più urgente: “un passo fondamentale verso la costruzione di comunità e nazioni più sicure e resilienti”, scrivono. 

I ricercatori dell'Unione Internazionale di Chimica Pura e Applicata (IUPAC) ha affrontato uno studio di caso per esaminare come i dati e la terminologia relativi alle sostanze chimiche possano essere resi più facilmente fruibili sia dagli esseri umani che dalle macchine. 

L'IUPAC ha più di un secolo di esperienza convocare i chimici per definire e standardizzare il modo in cui gli scienziati nel campo lavorano e parlano di sostanze chimiche. Ma poiché gli strumenti digitali, e sempre più l'intelligenza artificiale e la tecnologia correlata, offrono nuovi modi di lavorare, lo studio di caso IUPAC ha esaminato come tali standard potrebbero essere resi più efficienti e rendere più facile per altri scienziati riutilizzare i dati chimici. 

Uno dei prodotti dello studio di caso era un “ricettario”, una risorsa aperta di linee guida per aiutare gli scienziati, tra cui studenti, insegnanti e professionisti, a comprendere come lavorare con i dati chimici e come rendere i propri dati più accessibili ad altri. 

Il progetto descriveva anche un ambizioso nuovo protocollo digitale aperto che avrebbe potuto collegare tra loro molti database chimici globali diversi, consentendo agli scienziati di trovare e accedere ai dati con un'unica query e, allo stesso tempo, di verificare se i propri dati sono leggibili da una macchina. 

Costruire un linguaggio condiviso per i dati scientifici

Riunire gli scienziati per parlare dei dati che producono e cercare di capire come gli altri lavorano con i propri dati è stato illuminante, spiega Hodson. 

E stabilendo standard e definizioni chiari, gli scienziati non solo aiutano la ricerca attuale, ma rendono anche più facile per le generazioni successive sviluppare il loro lavoro, forse in modi che gli autori originali non avrebbero mai preso in considerazione, aggiunge. 

"Ciò che abbiamo scoperto in WorldFAIR è stato quanto fosse affascinante e utile semplicemente avere queste conversazioni, riunire tutti i casi di studio in una stanza e farli parlare dei loro dati, di cosa fanno, di come funzionano e di come li descrivono, e in alcuni casi identificare connessioni che non avevamo necessariamente immaginato in anticipo", afferma. 


Potrebbe anche interessarti

blog
24 Luglio 2024 - 5 min letto

WorldFAIR: continuare a trasformare i dati per affrontare sfide complesse in un progetto di follow-up

Scopri di più Scopri di più su WorldFAIR: continuare a trasformare i dati per affrontare sfide complesse in un progetto di follow-up
Scienza dei dati blog
07 Giugno 2022 - 11 min letto

Implementazione dei principi dei dati FAIR: cosa c'è dietro l'acronimo?

Scopri di più Scopri di più sull'implementazione dei principi sui dati FAIR: cosa si nasconde dietro l'acronimo?

Immagine di Taylor Vic on Unsplash.


Negazione di responsabilità

Le informazioni, le opinioni e le raccomandazioni presentate nei nostri blog degli ospiti sono quelle dei singoli contributori e non riflettono necessariamente i valori e le convinzioni dell'International Science Council


Abilita JavaScript nel tuo browser per completare questo modulo.

Rimani aggiornato con le nostre newsletter

Salta al contenuto