Registriĝi

De siligitaj datumoj ĝis komuna scio: Kiel WorldFAIR formas la estontecon de esplorado

Sciencistoj ofte alfrontas defiojn en aliro kaj uzado de esplordatenoj pro malkonsekvenca terminologio, nestrukturitaj formatoj kaj mankantaj detaloj. La WorldFAIR-projekto traktas ĉi tiujn aferojn promociante la principojn de FAIR (Trovebla, Alirebla, Interoperable, Reuzebla) por plibonigi datumajn alireblecojn kaj kreskigi kunlaboron trans disciplinoj. Ĉe la kerno de la projekto estas 11 kazesploroj kovrantaj larĝan gamon de sciencaj kampoj kaj tutmondaj komunumoj.

Ciferecaj iloj ofertas ĉiam kreskantajn ŝancojn por kunlabora scienco akceptanta tutmondajn defiojn - sed tro ofte, valoraj datumoj necesaj por informi ke laboro restas ekstere de atingo por esploristoj.

Datenoj povas esti entombigitaj en neesplorebla kolekto, koditaj kun idiosinkrazia terminologio aŭ en maniero kiel kiu ne povas facile esti farita por labori kun aliaj datenoj - aŭ ne facile uzeblaj ĉar sciencistoj ne povas kontroli detalojn pri la datumoj mem, kiel ĝiaj originoj aŭ terminoj de uzado.

"Ĉi tio estas problemo kiu estas fakte same malnova kiel la scienco mem", klarigas Simon Hodson, la plenuma direktoro de la Komitato pri Datumoj (CODATA) de la Internacia Scienca Konsilio (ISC), kiu laboras por plibonigi la haveblecon kaj uzeblon de datumoj.

Ĉi tiuj datumproblemoj povas limigi esplorŝancojn, kaj malŝpari tempon kaj monon. Laŭ esploro eldonita de la Eŭropa Komisiono en 2018, purigi malbonkvalitajn datumojn por igi ĝin uzebla estas senkompare la plej tempopostula tasko por averaĝa datuma analizprojekto, kaj povas sumiĝi al 80% de la tuta fortostreĉo.

la Monda FOIRO projekto, kunlaboro inter CODATA kaj la Internacia Scienca Konsilio (ISC), akceptis tiun problemon. La projekto celis "fari datumojn funkcii" instigante la adopton de la FOIRO (Trovebla, Alirebla, Interoperable, Reuzebla) datumprincipoj, kreskigante pli bonan datuman administradon kaj esploradon subtenatan de maŝin-helpata analizo. 

Kun la projekto finiĝanta, CODATA celas daŭrigi kaj vastigi la iniciaton kun WorldFAIR+, kiu inkluzivos novajn partnerojn kaj internaciajn kazesplorojn metantajn en praktikon lernitajn lecionojn dum la dujara projekto WorldFAIR. 

La nova fazo estos strukturita kiel "federacio" de projektoj, disponigante kadron por kunlaboro kie sciencistoj povas kunhavi teknikan kompetentecon kaj konstrui sur unu la alian laboron. CODATA invitas eblajn partnerojn sugesti kazesplorojn kaj partopreni.

Kazaj studoj pri interfunkciebleco de datumoj

La komenca laboro de CODATA kiu disponigis la bazon por WorldFAIR komenciĝis en 2017, kun subteno de la ISC kaj financado de la Ĉina Asocio por Scienco kaj Teknologio. Tiu forma laboro inkludis laborrenkontiĝojn kiuj kaŭzis la evoluon de tri kazesploroj, kiuj ĉiu temigis datenuzon en specifa kampo: infektaj malsanoj, urboplanado kaj katastrofriskoredukto. En la komencaj stadioj de la projekto, CODATA ankaŭ evoluigis ŝlosilan partnerecon kun la Data Dokumentado-Iniciato (IDD).

Konstruante sur ĉi tiuj klopodoj, CODATA certigis financado de la Eŭropa Komisiono por WorldFAIR. La projekto apogis 11 kazesplorojn ekzamenantajn uzon de datumoj en larĝa gamo de kampoj - inkluzive de kultura heredo, nanomaterialoj kaj oceanscienco. La kazesploroj ampleksis 13 landojn, inkluzive de Brazilo, Kenjo, Nov-Zelando kaj Usono

Lecionoj lernitaj de la projekto formis la bazon de 11 politikaj rekomendoj plibonigi la uzon kaj haveblecon de datumoj por scienco, kaj kaŭzis la evoluon de la Inter-Domajna Kunfunkciebleco-Kadro (CDIF), kiu celas igi datumojn de malsamaj sciencaj kampoj pli interoperacieblaj. 

Samtempe, CODATA publikigis novajn Research Data Management Terminology, kiu disponigas klarajn difinojn de esprimoj uzitaj en la kampo; tiuj terminoj nun estis publikigitaj kiel maŝinlegebla "JUSTA vortprovizo”, kaj baldaŭ disponeblas rete en pli facile homlegebla formato. 

Ĉiu el la 11 kazesploroj ankaŭ generis sian propran raportoj kaj gvidado por uzado de datumoj, celante fari rekomendojn trafaj trans malsamaj domajnoj de scienco. 

Unu el la kazesploroj rigarditaj agrikultura biodiverseco, temigante polenadon - kampo kie la modelo por priskribi kaj kategoriigi datenojn daŭre estas difinita. Bazante sur datumoj kaj enigaĵoj de kolegoj tra la mondo, esploristoj el duona dekduo da landoj - Brazilo, Kenjo, Argentino, Usono, Britio kaj Nederlando - evoluigis ampleksa gvidilo kaj aro de iloj por datumoj rilataj al kiel plantoj kaj polenigistoj interagas. 

Ĝi estas ekstreme specifa temo, sed unu kiu rilatas preskaŭ ĉie, al sciencistoj en iuj diversaj kampoj - kiuj nun povas profiti el unuigita, norma maniero alproksimiĝi al la datumoj, faciligante konstrui sur la laboro de kolegoj kaj akceli sian. propran esploron. 

"Movi de diversaj aliroj kaj izolitaj iniciatoj al vaste haveblaj FAIR-plant-polenaj interagaj datumoj por sciencistoj kaj deciduloj ebligos la disvolviĝon de integraj studoj, kiuj plibonigas nian komprenon pri speciobiologio, konduto, ekologio, fenologio kaj evoluo", skribi esploristojn kiuj laboris pri la kazesploro

En alia kaza studo, esploristoj rigardis Redukto de risko de katastrofoj. "Ĉar klimata ŝanĝo kaj pliigitaj populacioj verŝajne pliigos kaj la severecon kaj oftecon de katastrofo, la bezono de fidindaj datumoj por informi niajn respondojn fariĝas ĉiam pli kritika," ili skribas. 

Sciencistoj kaj naciaj kaj internaciaj agentejoj laborantaj pri katastrofa risko rigardas al la pasinteco por taksi la efikon de eblaj estontaj eventoj, kaj kompreni kiel mildigi kaj resaniĝi poste. Ili ankaŭ uzas datumojn konstante forigitaj de sensiloj sur la tero kaj sur satelitoj, prizorgitaj de publikaj kaj privataj fontoj.

Sed en la kazesploro, esploristoj trovis malfacile akiri la specon de informoj necesaj por fari precizajn taksojn, ĉar multaj el la koncernaj datumoj ne konformas al la FAIR-datumprincipoj. Esencaj informoj ofte mankas - kiel la nombro da homoj vunditaj en katastrofo, aŭ kiom rapide la evento disvolviĝis. En aliaj kazoj, naciaj aŭtoritatoj uzas siajn proprajn metodojn por kalkuli ŝlosilajn datumpunktojn sen montri sian laboron, malfaciligante al aliaj kompari.

Surbaze de sia ampleksa esplorado, la kazesploro-teamo faris serion da rekomendoj por praktikoj, kiuj devus faciligi fari pruv-bazitajn politikajn decidojn en ĉi tiu ĉiam pli urĝa kampo - "fundamenta paŝo al konstruado de pli sekuraj, pli rezistemaj komunumoj kaj nacioj", ili skribas. 

Esploristoj kun la Internacia Unio de Pura kaj Aplikata Kemio (IUPAC) akceptis kazesploron rigardantan kiel datenoj kaj terminologio rilataj al kemiaĵoj povas fariĝi pli facile uzeblaj por kaj homoj kaj maŝinoj. 

IUPAC havas pli ol jarcento da sperto kunvenigi kemiistojn por difini kaj normigi la manieron kiel sciencistoj en la kampo laboras kun kaj parolas pri kemiaĵoj. Sed ĉar ciferecaj iloj - kaj ĉiam pli AI kaj rilata teknologio - ofertas novajn manierojn labori, la kazesploro de IUPAC rigardis kiel tiuj normoj povus fariĝi pli efikaj, kaj faciligi al aliaj sciencistoj reuzi kemiajn datumojn. 

Unu el la produktoj de la kazesploro estis "kuirlibro”, malferma rimedo de gvidlinioj por helpi sciencistojn - inkluzive de studentoj, instruistoj kaj laborantaj profesiuloj - kompreni kiel labori kun kemiaj datumoj, kaj kiel fari siajn proprajn datumojn pli alireblaj por aliaj. 

La projekto ankaŭ priskribis ambician novan malferman ciferecan protokolon, kiu povus kunigi multajn malsamajn tutmondajn kemiajn datumbazojn, permesante al sciencistoj trovi kaj aliri datumojn per ununura demando - kaj egale kontroli ĉu iliaj propraj datumoj estas maŝinlegeblaj. 

Konstruado de komuna lingvo por sciencaj datumoj

Kunvenigi sciencistojn por paroli pri la datumoj, kiujn ili produktas, kaj provi kompreni kiel aliaj laboras kun siaj propraj datumoj, estis okulfrapa, Hodson klarigas. 

Kaj fiksante klarajn normojn kaj difinojn, sciencistoj ne nur helpas al aktuala esplorado, sed ankaŭ faciligas al sinsekvaj generacioj konstrui sur sia laboro - eble laŭ manieroj kiujn la originaj aŭtoroj eble neniam pripensis, li aldonas. 

"Io, kion ni trovis en WorldFAIR, estis kiom fascina kaj utila estis simple havi ĉi tiujn konversaciojn, ricevi ĉiujn kazesplorojn en ĉambro kaj paroli pri siaj datumoj kaj kion ili faras kaj kiel ĝi funkcias kaj kiel ili priskribas ĝin. – kaj en kelkaj okazoj identigi ligojn, kiujn ni ne nepre imagis antaŭe,” li diras. 


Vi eble ankaŭ interesiĝas

blogo
24 julio 2024 - 5 min legita

WorldFAIR: Daŭre transformi datumojn por trakti kompleksajn defiojn en sekva projekto

Lernu pli Lernu pli pri WorldFAIR: Daŭre transformi datumojn por trakti kompleksajn defiojn en sekva projekto
Scienco de datumoj blogo
07 junio 2022 - 11 min legita

Efektivigo de FAIR-datumprincipoj - kio estas malantaŭ la akronimo?

Lernu pli Lernu pli pri Implementing FAIR-datumprincipoj – kio estas malantaŭ la akronimo?

bildo de Taylor Vick on Unsplash.


malgarantio

La informoj, opinioj kaj rekomendoj prezentitaj en niaj gastblogoj estas tiuj de la individuaj kontribuantoj, kaj ne nepre reflektas la valorojn kaj kredojn de la Internacia Scienca Konsilio.


Bonvolu ebligi JavaScript en via retumilo por kompletigi ĉi tiun formularon.

Restu ĝisdatigita kun niaj informiloj

Rekte al enhavo