La información está efectivamente disponible cuando ésta es colocada en un formato adecuado para el uso del usuario, esto es, en la forma de un producto de información (imágenes, texto, bases de datos, gráficos, imágenes, shapes, entre otros), o de un aplicativo al cual se tiene igualmente acceso.
Como se ha comentado anteriormente, se recomienda el uso de formatos de intercambios de datos que sean de libre acceso. En este contexto, cabe introducir el concepto de open data o formato de datos libres:
“El open data es una filosofía y una práctica que requiere que ciertos datos sean de libre acceso para todo el mundo, sin limitaciones técnicas o legales. En el sector público, tener acceso a los datos de la administración estatal garantiza la transparencia, la eficiencia y la igualdad de oportunidades, a la vez que se crea valor. La transparencia porque se pueden consultar y tratar datos que vienen directamente de las fuentes oficiales, la eficiencia porque ciudadanos y organizaciones pueden crear servicios de forma más ajustada en colaboración con el estado; y la igualdad de oportunidades porque el acceso es el mismo para todo el mundo.”
La definición de apertura completa se resume mediante los siguientes detalles:
- Disponibilidad y acceso: la información debe estar disponible como un todo, preferiblemente descargándola de internet. Además, debe estar disponible en una forma conveniente y modificable.
- Reutilización y redistribución: los datos deben ser provistos bajo términos que permitan reutilizarlos y redistribuirlos, e incluso integrarlos con otros conjuntos de datos.
- Participación universal: todos deben poder utilizar, reutilizar y redistribuir la información. No debe haber discriminación alguna en términos de esfuerzo, personas o grupos. Restricciones “no comerciales” que prevendrían el uso comercial de los datos; o restricciones de uso para ciertos propósitos no son permitidos.
En resumen, el open data permite que terceros puedan usar y reutilizar la información. Estos formatos de libre acceso o de datos abiertos son la base para la interoperabilidad. Para ello, se debe tener en cuenta lo siguiente:
Licencia de uso
De forma general, los conjuntos de datos expuestos se ofrecen bajo licencias de propiedad abiertas, que permiten su redistribución, reutilización y aprovechamiento con fines comerciales. No obstante, existen algunas diferencias dependiendo del tipo de dato por lo que se recomienda realizar una ficha donde se detalle los términos de uso, que se orientan siempre a su reutilización.
Información técnica
Los open data tienen características técnicas y formatos muy diversos que requieren diferentes niveles de conocimientos (Ver Recuadro 9 formato de intercambio de datos). A continuación se ofrece una clasificación de los grandes grupos de datos en función de sus características técnicas, que se puede adoptar en el sistema o red de información:
- Datos estadísticos, se encuentran la mayor parte en formato Excel (formato propietario) y csv.
- Datos publicados por los miembros del SI o RI. Estos contenidos pueden ser muy diversos: ayudas y subvenciones, contratos públicos, eventos, noticias, información turística, etc. Se publican en internet a través de un Gestor de Contenidos y automáticamente pasan al SI o RI. Estos datos se ofrecen en varios formatos. Los formatos Excel, xml y json no contienen todos los datos de forma exhaustiva, tan solo algunos de los datos más relevantes. Para acceder a la totalidad de los datos es necesario acceder a ellos a través de un interfaz de programación de aplicaciones (API[1]). Para reutilizar los datasets a través del API se requieren conocimientos de desarrollo/programación.
- Datos de otras bases de datos independientes. Existe mucha información accesible desde el SI o RI que puede provenir de bases de datos independientes, y que requieren de un proceso periódico y automatizado de exportación de esos datos a formatos Open Data. Estos datos se suelen caracterizar por:
- Actualización alta (frecuentemente en tiempo real).
- Formatos: csv, Excel, xml o formatos semánticos (rdf-xml, rdf-turtle, sparql-xml).
- En ocasiones, debido al volumen de datos, los ficheros se pueden comprimir en un ZIP.
- Algunos datos que pueden ser recogidos en este grupo son: calidad de las aguas, calidad del aire, datos meteorológicos, etc.
- Datos geográficos. Los datos geográficos, debido a su naturaleza especial, se ofrecen en formatos específicos y requieren en ocasiones de software especializado para su reutilización. Los formatos son: wms, kml, pdf, shp (propietario).
- Datos de baja actualización. Por último, se pueden tener datos no automatizados que se caracterizan por:
- Datos disponibles en formatos sencillos como Excel, csv, Access o LibreOffice.
- Baja actualización (anual) o sin periodicidad.
- Actualización manual: requieren de una persona que actualice los datos periódicamente.
- Algunos datos de este grupo: emisiones y fuentes contaminantes, toponimia, archivo fotográfico, etc.
[1] del inglés: Application Programming Interface