5 Principios para maximizar el uso de los datos abiertos

Artículo
23 Diciembre 2014

 

Utilizar datos de gobierno es frustrante; lo digo por experiencia propia. Empezamos navegando un laberinto de portales y menús crípticos para llegar a un listado de ligas a conjuntos de datos que apenas funcionan y cuentan con descripciones vagas. Después de una larga descarga de cientos de MB y algunos GB nos damos cuenta que el archivo sólo abre bajo cierto sistema operativo o con cierto software propietario. Aún pasando estas barreras, seguro nos encontraremos con datos inconsistentes y sin estructurar que complicarán el trabajo a cualquier usuario. Este escenario es común en las iniciativas de datos abiertos, a diferentes niveles, idiomas, y latitudes. Y es por esto que en la Iniciativa de Datos Abiertos de México nos propusimos definir principios básicos que sirvan de guía para abrir datos de calidad, es decir, datos en su mejor estado para ser aprovechados por la sociedad. 

A continuación les presentamos 5 de estos principios: 1 Genera y publica un plan de apertura Donde reflejes la atención a la demanda ciudadana por datos, generalmente identificable en solicitudes de acceso a la información en oficinas de Transparencia y accountability, y puntos de interacción con el sector público, privado y social. Además de la demanda ciudadana, otro punto de referencia es lo que denominamos “infraestructura de datos” que engloba datos de interés nacional que son elementales para el mejoramiento de política pública, el desarrollo económico y el fortalecimiento de la sociedad civil. Una referencia práctica sobre qué encontrar en esta infraestructura son las categorías definidas por el Open Data Census en census.okfn.org 2 Exporta a formatos abiertos. 

La manera más clara, sencilla y universal de presentar datos es en formato tabular, particularmente CSV. Este formato es versátil y ligero; se puede usar en una hoja de cálculo o en una librería de algún lenguaje de programación. Un CSV son simples registros con sus propiedades representadas por valores en columnas, como se ve en el siguiente ejemplo: sitio, país, datasets datos.gob.mx, México, 200 data.gov.uk, Reino Unido, 19869 datos.gob.cl, Chile, 1180 3 Facilita el uso Buena parte de nuestra audiencia tendrá preferencia por otros formatos y flujos de trabajo. Es por esto que recomendamos publicar también en formatos convenientes o comúnmente utilizados por grupos expertos o líderes en el área, sector o industria. Por ejemplo, si el dataset contiene ubicaciones de restaurantes podríamos publicarlo en un formato geoespacial, como GeoJSON o inclusive Shapefile, facilitando así la creación de mapas o su incorporación a sistemas de información geoespacial. Otro factor importante para el uso de datos es facilitar la descarga. Si se publican datos como archivos estáticos, es recomendable subirse a un Content Delivery Network, ya que acelera las descargas y desvía el tráfico de nuestros servidores.

 Si se publican datos constantemente se recomienda exponer los datos a través de un API o servicio web. 4 Documenta con detalle Utilizar datos no debería ser confuso para los usuarios; es importante explicar claramente su origen, y de preferencia agregar referencias adicionales donde se defina a mayor detalle el proceso de generación y transformación de los datos. Los diccionarios de datos son esenciales para esta tarea, por ejemplo: https://data.linz.govt.nz/layer/804-nz-property-titles. En datos.gob.mx hacemos obligatorio el uso de DCAT como estándar de documentación (mínima) para los datos abiertos.

Ver artículo original