Sari la conținut

Politica datelor deschise

NEW YORK – Ideea de date deschise a ajuns în mainstream. Totuși, în ciuda beneficiilor multiple ale publicării de date gratuite, mai sunt multe de făcut până să ajungă o practică răspândită.

laptop internet_shutterstock_594171068

FOTO: Shutterstock

În ultimii cinci ani, mari finanțatori publici și privați ai programelor de cercetare - inclusiv Fundația Bill & Melinda Gates,  Wellcome Trust,  National Institutes of Health (NIH) și NASA - au instituit politici de “data-sharing” iar administrațiile naționale, statale și municipale din Statele Unite au promovat portalurile de date deschise. Publicațiile academice au adoptat și ele politica datelor deschise iar unele publicații științifice au luat măsuri care încurajează sau chiar pretind utilizarea în comun a datelor.

Dar practica utilizării în comun a datelor a stagnat. În raportul Figshare din 2017 se arată că 60% din cei 2.300 de cercetători intervievați au declarat că își fac publice datele “frecvent sau uneori” și doar 20-30% au declarat “frecvent.” Un alt studiu recent efectuat pe 1200 de cercetători a descoperit că “mai puțin de 15% dintre aceștia își pun datele într-un data repository (arhivă electronică specializată).” Accesul la date nu este regula în domeniul meu de activitate - științele sociale.

În mod clar, abordarea preponderentă de promovare a datelor deschise - dacă le ordoni, vor publica datele - nu funcționează. Pentru a produce schimbarea, cercetătorii înșiși trebuie să îmbrățișeze principiul datelor deschise.

Iar pentru asta este nevoie de informare corectă și de stimulente. Pe scurt, avem nevoie mai mult de recompense decât de sancțiuni.

În realitate, cerința de a publica datele este o sancțiune. La fel și replicarea, un alt argument în favoarea publicării datelor. Bineînțeles, replicarea studiilor este crucială iar știința suferă acum o criză a replicării. Dar, într-un sondaj din 2016 făcut pe un eșantion de 4600 de cercetători, doar 31% dintre cei care și-au publicat datele au declarat că au fost motivați de “transparență și reutilizare.”

Principalele motive pentru care cercetătorii ezită să-și facă publice datele, conform aceluiași studiu, țin de proprietatea intelectuală, confidențialitate, teama de interpretare sau utilizare greșită sau furtul de idei. Din cauza modelului “publici sau dispari” care definește cariera academică și a mediului competitiv de finanțare a cercetărilor, indivizii profită mai mult când “dețin” datele pe care se bazează cercetarea lor decât atunci când le pun la dispoziție și altora.

E momentul să schimbăm discuția despre “data sharing” de la ce pot pierde cercetătorii la ce pot ei să câștige. Vestea bună este că publicațiile de date unde își pot publica cercetătorii seturile de date sunt deja în expansiune. Numărul de citări în trei dintre cele mai mari publicații cu acces deschis (Data in Brief, Biodiversity Data Journal, și Scientific Data) au crescut de la 3 în 2012 la 1.028 în 2016.

Alt stimulent este că prin data sharing se maximizează randamentul investiției pentru cercetător și pentru finanțator. În acest moment, registrele de studii și 

portalurile de date disparate fac dificilă găsirea unor proiecte similare de către cercetătorul individual care colectează date pentru a fi publicat în jurnale cu impact mare. Acest lucru crește riscul ca timpul cercetătorului și banii finanțatorului să se piardă pe proiecte care se suprapun cu ale altui cercetător.

În mod similar, pentru o evaluare randomizată în Zambia la care am lucrat, eu și colegii mei am colectat date despre aproximativ 2.500 de adolescenți și tineri. Pentru a respecta condițiile puse de finanțatorul proiectului, noi publicăm rezultatele obținute din utilizarea a 10% din date în reviste științifice cu evaluare inter-pares. Însă nu avem fondurile necesare pentru a analiza și restul informațiilor din setul de date (o problemă des întâlnită de cercetători). Dacă accesul la datele noastre neutilizate ar fi deschis, am putea atrage noi colaboratori și am am putea genera analize mai solide.

Folosirea datelor deschise existente oferă posibilitatea cercetătorilor să formuleze întrebări inovative și obiective de cercetare care sunt mult mai probabil să conducă la descoperiri cruciale. Dincolo de accelerarea progresului, colaborarea bazată pe data sharing amplifică abilitatea cercetătorilor de a obține finanțarea necesară pentru că finanțatorii sunt atrași de munca inovativă, interdisciplinară.

Totuși, pentru a beneficia de data sharing, finanțatorii trebuie să-și schimbe și ei mentalitatea și să investească mai mult în colectarea și managementul de calitate a datelor în timpul implementării proiectelor precum și să susțină finanțarea arhivării și analizei continue a seturilor de date. Cercetătorilor trebuie să li se ofere 

timpul și resursele necesare pentru a scoate tot ce este posibil din datele pe care le colectează.

Un alt efect pozitiv obținut prin data sharing este susținerea cercetătorilor în viitor, când aceștia vor putea folosi datele colectate deja în alt scop. La începutul carierei mele la NIH (National Institutes of Health) am avut norocul să am acces la multiple seturi de date interne ale cercetătorilor de la NIH și Johns Hopkins University și am petrecut doi ani făcând analize secundare asupra acestor date. Pe baza unor  lucrări anterioare am reușit să public o serie de studii care mi-au impulsionat cariera în cercetare.

Pe lângă stimulentele pentru cercetători și finanțatori, este nevoie de o schimbare fundamentală în cultura științifică pentru a accelera progresul științific, iar în prezent există mai multe inițiative promițătoare în acest sens.

De exemplu, Center for Open Science promovează deschiderea, integritatea și reproductibilitatea cercetării științifice. The Berkeley Initiative for Transparency in the Social Sciences furnizează date deschise și formare în domeniul transparenței cercetării pentru a consolida integritatea cercetării și utilizarea dovezilor științifice în elaborarea politicilor. Cochrane-REWARD prize încearcă să maximizeze utilizarea fondurilor de cercetare din care se risipesc anual aproximativ 170 de miliarde de dolari.

Aceste inițiative sunt eficiente însă este nevoie de mai mult pentru a face ca cercetătorii să devină forța motrice a fenomenului data sharing. Girl Innovation, Research, and Learning Center, centrul global de cercetare a 

adolescenților pe care îl conduc în cadrul organizației Population Council, construiește cel mai mare Adolescent Data Hub din lume, un portal global unic unde cercetătorii și organizațiile pot publica și accesa date cantitative de calitate despre peste un milion de indivizi.

Credem că datele deschise pot accelera transparența cercetării și soluțiile inovative cu impact semnificativ asupra vieților celei mai numeroase generații de adolescenți - 1,2 miliarde de persoane. Și mai credem că, pe măsură ce practica datelor deschise se răspândește, beneficiile colaborării pe care aceasta o permite se vor extinde tot mai mult.

(Un articol apărut în The Project Syndicate sub semnătura lui Thoai Ngo)

Etichete: date deschise

Pe aceeași temă
Confidenţialitatea ta este importantă pentru noi. Vrem să fim transparenţi și să îţi oferim posibilitatea să accepţi cookie-urile în funcţie de preferinţele tale.
De ce cookie-uri? Le utilizăm pentru a optimiza funcţionalitatea site-ului web, a îmbunătăţi experienţa de navigare, a se integra cu reţele de socializare şi a afişa reclame relevante pentru interesele tale. Prin clic pe butonul "DA, ACCEPT" accepţi utilizarea modulelor cookie. Îţi poţi totodată schimba preferinţele privind modulele cookie.
Da, accept
Modific setările
Alegerea dumneavoastră privind modulele cookie de pe acest site
Aceste cookies sunt strict necesare pentru funcţionarea site-ului și nu necesită acordul vizitatorilor site-ului, fiind activate automat.
- Afișarea secţiunilor site-ului - Reţinerea preferinţelor personale (inclusiv în ceea ce privește cookie-urile) - Reţinerea datelor de logare (cu excepţia logării printr-o platformă terţă, vezi mai jos) - Dacă este cazul, reţinerea coșului de cumpărături și reţinerea progresului unei comenzi
Companie Domeniu Politica de confidenţialitate
RCS&RDS S.A. digi24.ro Vezi politica de confidenţialitate
prv_level, civicCookieControl, m2digi24ro, stickyCookie
Google Analytics google.com Vezi politica de confidenţialitate
_ga, _gid, _gat, AMP_TOKEN, _gac_<property-id>, __utma, __utm, __utmb, __utmc, __utmz, __utmv
CXENSE cxense.com Vezi politica de confidenţialitate
cX_S, cX_P, gcks, gckp, _cX_segmentInfo, cX_T
Google IDE google.com Vezi politica de confidenţialitate
IDE
Vă rugăm să alegeţi care dintre fişierele cookie de mai jos nu doriţi să fie utilizate în ce vă priveşte.
Aceste module cookie ne permit să analizăm modul de folosire a paginii web, putând astfel să ne adaptăm necesității userului prin îmbunătățirea permanentă a website-ului nostru.
- Analiza traficului pe site: câţi vizitatori, din ce arie geografică, de pe ce terminal, cu ce browser, etc, ne vizitează - A/B testing pentru optimizarea layoutului site-ului - Analiza perioadei de timp petrecute de fiecare vizitator pe paginile noastre web - Solicitarea de feedback despre anumite părţi ale site-ului
Companie Domeniu Politica de confidenţialitate
CrazyEgg crazyegg.com Vezi politica de confidenţialitate
ce2ab, ce_login, ceac, sid, _ceir, is_returning, _CEFT, ceg.s, ceg.u, __ar_v4, __distillery, __zlcmid, __zprivacy, _ga, _gat, ki_r, ki_s, ki_t, ki_u, km_ai, km_lv, km_ni, km_uq, km_vs, kvcd, optimizelyBuckets, optimizelyEndUserId, optimizelyPendingLogEvents, optimizelySegments
CXENSE cxense.com Vezi politica de confidenţialitate
cx_profile_timeout, cx_profile_data
Aceste module cookie vă permit să vă conectaţi la reţelele de socializare preferate și să interacţionaţi cu alţi utilizatori.
- Interacţiuni social media (like & share) - Posibilitatea de a te loga în cont folosind o platformă terţă (Facebook, Google, etc) - Rularea conţinutului din platforme terţe (youtube, soundcloud, etc)
Companie Domeniu Politica de confidenţialitate
Facebook facebook.com Vezi politica de confidenţialitate
a11y, act, csm, P, presence, s, x-referer, xs, dpr, datr, fr, c_user
Youtube youtube.com Vezi politica de confidenţialitate
GED_PLAYLIST_ACTIVITY,APISID, GEUP, HSID, LOGIN_INFO, NID, PREF, SAPISID, SID, SSID, SIDCC, T9S2P.resume, VISITOR_INFO1_LIVE, YSC, dkv, s_gl, wide
Twitter twitter.com Vezi politica de confidenţialitate
_twitter_sess, auth_token, lang, twid, eu_cn, personalization_id, syndication_guest_id, tfw_exp
Aceste module cookie sunt folosite de noi și alte entităţi pentru a vă oferi publicitate relevantă intereselor dumneavoastră, atât în cadrul site-ului nostru, cât și în afara acestuia.
- Oferirea de publicitate în site adaptată concluziilor pe care le tragem despre tine în funcţie de istoricul navigării tale în site și, în unele cazuri, în funcţie de profilul pe care îl creăm despre tine. Facem acest lucru pentru a menţine site-ul profitabil, în așa fel încât să nu percepem o taxă de accesare a site-ului de la cei care îl vizitează. - Chiar dacă astfel de module cookie nu sunt utilizate, te rugăm să reţii că ţi se vor afişa reclame pe site-ul nostru, dar acestea nu vor fi adaptate intereselor tale. Aceste reclame pot să fie adaptate în funcţie de conţinutul paginii.
Companie Domeniu Politica de confidenţialitate
Google DFP google.com Vezi politica de confidenţialitate
__gads, id, NID, SID, ANID, IDE, DSID, FLC, AID, TAID, exchange_uid, uid, _ssum, test_cookie, 1P_JAR, APISID, evid_0046, evid_0046-synced
Trimite
Vezi aici politica noastră de cookie-uri și de prelucrare a datelor tale