OpenCitationsOpenCitations és una organització independent per proveir dades i infraestructures a la ciència oberta. En concret, està dedicada a la publicació oberta de dades bibliogràfiques i citacions mitjançant les tecnologies del web semàntic de dades enllaçades (en anglès, linked data). També es dedica a la promoció de les citacions obertes, en particular com a membre fundador de la Initiative for Open Citations (I4OC). Impulsada per la University of Oxford i la Università di Bologna, aquesta organització i la infraestructura de dades és gestionada pel Research Centre for Open Scholarly Metadata de la universitat italiana.

En el marc de la ciència oberta, l’objectiu d’OpenCitations és la creació i expansió d’un corpus bibliogràfic obert, que es pot descarregar i que funciona també com a índex de citacions. En tot moment es compleix els FAIR data principles de la comunitat Force11, segons els quals les dades han de ser localitzables, accessibles, interoperables i reutilitzables.

OpenCitations és una iniciativa no comercial, que compta amb el finançament de fundacions, xarxes i organitzacions sense finalitat de lucre. Els seus impulsors volen seguir ampliant la cobertura a totes les àrees del coneixement fins a convertir-lo en una alternativa als productes comercials d’empreses multinacionals com Clarivate Analytics i Elsevier.

També es compleixen les recomanacions de la I4OC perquè les dades de citacions siguin estructurades, separables i obertes. En aquest sentit, OpenCitations ha publicat recentment una definició oficial del concepte de “citació oberta”, i ha posat en marxa un sistema d’identificadors únics i persistents a escala mundial per a cada citació bibliogràfica: els Open Citation Identifiers (OCI).

A banda de diversos serveis i eines, actualment OpenCitations està centrat en el desenvolupament de dos grans tipus de conjunts de dades obertes a partir d’altres bases de dades (bàsicament Europe PubMed Central, amb aportacions addicionals de Crossref i ORCID):

1) OpenCitations Indexes: aquests índexs contenen informació sobre les citacions, que són tractades com a entitats de dades de primera classe. Això permet dotar cada citació amb propietats descriptives: data de citació; interval entre publicació i citació; i tipus (si és o no una autocitació). Aquests índexs no emmagatzemen metadades sobre les entitats bibliogràfiques citades i citants, que són identificades només amb el seu DOI. En aquest àmbit, l’índex més gran és el OpenCitations Index of Crossref open DOI-to-DOI citations (COCI), amb 58 milions de recursos bibliogràfics i 702,8 milions de citacions segons la darrera actualització (12/05/2020). Val a dir que les bases de dades Web of Science Core Collection (Clarivate Analytics) i Scopus (Elsevier) contenen aproximadament uns 75 milions de documents amb uns 1.500 milions de citacions.

2) OpenCitations Corpus (OCC): base de dades oberta i descarregable de dades bibliogràfiques i de citacions en format Resource Description Framework (RDF). El contingut actual prové principalment dels articles biomèdics indexats a Open Access Subset of PubMed Central. Actualment, presenta les referències de 326.743 recursos bibliogràfics citants i conté gairebé 14 milions de citacions a més de 7,5 milions de fonts citades.

Tots els conjunts de dades estan disponibles lliurement com a domini públic. A la vegada, el programari desenvolupat (bàsicament a partir dels estàndards RDF i SPARQL) per implementar tots els serveis està disponible lliurement a GitHub sota una llicència ISC.

Per a més informació, podeu consultar el lloc web OpenCitations, així com l’article “OpenCitations, an infrastructure organization for open scholarship” publicat recentment pels directors de la iniciativa a la revista Quantitative Science Studies.