Gli strumenti digitali offrono opportunità sempre crescenti per la scienza collaborativa che affronta sfide globali, ma troppo spesso i dati preziosi necessari per informare tale lavoro restano fuori dalla portata dei ricercatori.
I dati potrebbero essere sepolti in una raccolta non ricercabile, codificati con una terminologia idiosincratica o in un modo che non può essere facilmente utilizzato con altri dati, oppure non essere immediatamente utilizzabili perché gli scienziati non possono verificare i dettagli sui dati stessi, come le loro origini o le condizioni di utilizzo.
“Questo è un problema che in realtà è vecchio quanto la scienza stessa”, spiega Simone Hodson, il direttore esecutivo della Comitato per i dati (CODATA) dell'International Science Council (ISC), che lavora per migliorare la disponibilità e l'usabilità dei dati.
Questi problemi di dati possono limitare le opportunità di ricerca e sprecare tempo e denaro. Secondo riparazioni pubblicato dalla Commissione Europea nel 2018, ripulire i dati di scarsa qualità per renderli utilizzabili è di gran lunga l'attività che richiede più tempo per un progetto medio di analisi dei dati e può ammontare all'80% dello sforzo totale.
Il Fiera mondiale progetto, una collaborazione tra CODATA e l'International Science Council (ISC), ha affrontato questo problema. Il progetto mirava a "far funzionare i dati" incoraggiando l'adozione di FIERA Principi dei dati (trovabili, accessibili, interoperabili, riutilizzabili), che promuovono una migliore gestione dei dati e una ricerca supportata dall'analisi assistita dalla macchina.
Con la conclusione del progetto, CODATA intende continuare ed espandere l'iniziativa con FIERA Mondiale+, che includerà nuovi partner e casi di studio internazionali che metteranno in pratica le lezioni apprese nel corso del progetto biennale WorldFAIR.
La nuova fase sarà strutturata come una "federazione" di progetti, fornendo un quadro di collaborazione in cui gli scienziati possono condividere competenze tecniche e basarsi sul lavoro reciproco. CODATA invita potenziali partner a suggerire casi di studio e a partecipare.
Il lavoro iniziale di CODATA che ha fornito la base per WorldFAIR è iniziato nel 2017, con il supporto dell'ISC e il finanziamento dell' Associazione cinese per la scienza e la tecnologia. Quel lavoro formativo includeva workshop che hanno portato allo sviluppo di tre casi di studio, ciascuno dei quali si è concentrato sull'uso dei dati in un campo specifico: malattie infettive, pianificazione urbana e riduzione del rischio di catastrofi. Nelle fasi iniziali del progetto, CODATA ha anche sviluppato una partnership chiave con la Data Documentation Initiative (DDI).
Sulla base di questi sforzi, CODATA si è assicurata finanziamento della Commissione Europea per WorldFAIR. Il progetto ha supportato 11 casi di studio che esaminano l'uso dei dati in un'ampia gamma di campi, tra cui patrimonio culturale, nanomateriali e scienze oceaniche. I casi di studio hanno interessato 13 paesi, tra cui Brasile, Kenya, Nuova Zelanda e Stati Uniti
Le lezioni apprese dal progetto hanno costituito la base di 11 raccomandazioni politiche per migliorare l'uso e la disponibilità dei dati per la scienza e ha portato allo sviluppo dell' Framework di interoperabilità tra domini (CDIF), che mira a rendere più interoperabili i dati provenienti da diversi campi scientifici.
Allo stesso tempo, CODATA ha pubblicato nuovi Terminologia per la gestione dei dati di ricerca, che fornisce definizioni chiare dei termini utilizzati nel settore; tali termini sono stati ora pubblicati come un documento leggibile dalla macchina “Vocabolario FAIR”, e sarà presto disponibile online in un formato più facilmente leggibile.
Ciascuno degli 11 casi di studio ha generato anche il proprio relazioni e linee guida per l'utilizzo dei dati, con l'obiettivo di formulare raccomandazioni pertinenti nei diversi ambiti della scienza.
Uno dei casi di studio esaminati biodiversità agricola, concentrandosi sull'impollinazione, un campo in cui il modello per descrivere e categorizzare i dati è ancora in fase di definizione. Sulla base di dati e input da colleghi di tutto il mondo, ricercatori di mezza dozzina di paesi (Brasile, Kenya, Argentina, Stati Uniti, Regno Unito e Paesi Bassi) hanno sviluppato un guida completa e set di strumenti per dati relativi alle modalità di interazione tra piante e impollinatori.
Si tratta di un argomento estremamente specifico, ma rilevante quasi ovunque, per scienziati di numerosi campi diversi, che ora possono trarre vantaggio da un modo unificato e standard di approcciarsi ai dati, rendendo più facile basarsi sul lavoro dei colleghi e accelerare la propria ricerca.
“Passare da approcci diversi e iniziative isolate a dati FAIR ampiamente disponibili sulle interazioni tra piante e impollinazione per scienziati e decisori consentirà lo sviluppo di studi integrativi che migliorano la nostra comprensione della biologia, del comportamento, dell’ecologia, della fenologia e dell’evoluzione delle specie”, scrivono i ricercatori che hanno lavorato allo studio del caso.
In un altro studio di caso, i ricercatori hanno esaminato riduzione del rischio di catastrofi“Dato che il cambiamento climatico e l’aumento della popolazione probabilmente aumenteranno sia la gravità che la frequenza dei disastri, la necessità di dati affidabili per informare le nostre risposte diventa sempre più critica”, scrivono.
Gli scienziati e le agenzie nazionali e internazionali che lavorano sul rischio di catastrofi guardano al passato per stimare l'impatto di possibili eventi futuri e capire come mitigarli e riprendersi in seguito. Si basano anche sui dati che vengono costantemente sfornati da sensori sulla Terra e sui satelliti, gestiti da fonti pubbliche e private.
Ma nello studio del caso, i ricercatori hanno trovato difficile ottenere il tipo di informazioni necessarie per effettuare valutazioni accurate, perché molti dei dati rilevanti non si adattano ai principi dei dati FAIR. Spesso mancano informazioni vitali, come il numero di persone ferite in un disastro o la rapidità con cui si è svolto l'evento. In altri casi, le autorità nazionali utilizzano i propri metodi per calcolare i punti dati chiave senza mostrare il loro lavoro, rendendo difficile il confronto per gli altri.
Sulla base della loro ampia ricerca, il team dello studio di caso ha elaborato una serie di raccomandazioni per pratiche che dovrebbero semplificare l’adozione di decisioni politiche basate su prove in questo campo sempre più urgente: “un passo fondamentale verso la costruzione di comunità e nazioni più sicure e resilienti”, scrivono.
I ricercatori dell'Unione Internazionale di Chimica Pura e Applicata (IUPAC) ha affrontato uno studio di caso per esaminare come i dati e la terminologia relativi alle sostanze chimiche possano essere resi più facilmente fruibili sia dagli esseri umani che dalle macchine.
L'IUPAC ha più di un secolo di esperienza convocare i chimici per definire e standardizzare il modo in cui gli scienziati nel campo lavorano e parlano di sostanze chimiche. Ma poiché gli strumenti digitali, e sempre più l'intelligenza artificiale e la tecnologia correlata, offrono nuovi modi di lavorare, lo studio di caso IUPAC ha esaminato come tali standard potrebbero essere resi più efficienti e rendere più facile per altri scienziati riutilizzare i dati chimici.
Uno dei prodotti dello studio di caso era un “ricettario”, una risorsa aperta di linee guida per aiutare gli scienziati, tra cui studenti, insegnanti e professionisti, a comprendere come lavorare con i dati chimici e come rendere i propri dati più accessibili ad altri.
Il progetto descriveva anche un ambizioso nuovo protocollo digitale aperto che avrebbe potuto collegare tra loro molti database chimici globali diversi, consentendo agli scienziati di trovare e accedere ai dati con un'unica query e, allo stesso tempo, di verificare se i propri dati sono leggibili da una macchina.
Riunire gli scienziati per parlare dei dati che producono e cercare di capire come gli altri lavorano con i propri dati è stato illuminante, spiega Hodson.
E stabilendo standard e definizioni chiari, gli scienziati non solo aiutano la ricerca attuale, ma rendono anche più facile per le generazioni successive sviluppare il loro lavoro, forse in modi che gli autori originali non avrebbero mai preso in considerazione, aggiunge.
"Ciò che abbiamo scoperto in WorldFAIR è stato quanto fosse affascinante e utile semplicemente avere queste conversazioni, riunire tutti i casi di studio in una stanza e farli parlare dei loro dati, di cosa fanno, di come funzionano e di come li descrivono, e in alcuni casi identificare connessioni che non avevamo necessariamente immaginato in anticipo", afferma.
Immagine di Taylor Vic on Unsplash.
Negazione di responsabilità
Le informazioni, le opinioni e le raccomandazioni presentate nei nostri blog degli ospiti sono quelle dei singoli contributori e non riflettono necessariamente i valori e le convinzioni dell'International Science Council