Qué son los datos abiertos

Datos Abiertos, en inglés Open Data, es una Iniciativa de apertura de datos para su reutilización por parte de terceros de forma libre y gratuita.

La apertura de los datos públicos es una iniciativa de difusión de la información encuadrada dentro de las estrategias de Gobierno Abierto y Participativo comprometidas con el acceso y suministro de información sobre las actividades de los gobiernos como pilares de la transparencia, la colaboración y la participación ciudadana.

La Reutilización de la información del Sector Público (RISP) es uno de los objetivos fundamentales de Open Data consistente en el uso de documentos que obran en poder de las Administraciones y organismos del sector público por personas físicas o jurídicas, con fines comerciales o no comerciales, siempre que dicho uso no constituya una actividad administrativa pública y que el mismo no esté sujeto a las limitaciones establecidas legalmente.

Open Data y RISP son dos conceptos diferentes que tienen en común la filosofía de poner a disposición de la ciudadanía, en general, y de las empresas, en particular, datos en bruto, en formatos reutilizables y con licencias no restrictivas, facilitando su acceso con el fin de generar un valor añadido mediante la creación de nuevos servicios o aplicaciones.

La diferencia radica en que Open Data es un concepto más amplio, se trata de poner a disposición datos públicos y privados, en formatos totalmente abiertos, es decir, en formatos no propietarios y gratuitos; mientras que RISP, hace referencia sólo a los datos procedentes de las Administraciones Públicas, prevé la posibilidad de pago por el uso de los datos y la publicación de los mismos en cualquier formato reutilizable, es decir, incluye los formatos propietarios.

Los formatos reutilizables son formatos de datos estructurados, que pueden ser leídos o interpretados por máquina. Si además estos formatos no son propietarios se consideran formatos abiertos.

Dependiendo del nivel de reutilización se usan diferentes formatos:

  • Los más sencillos son los ficheros de datos Excel o CSV (Comma-separated values), los datos se presentan estructurados en forma de tabla, en el primer caso son formatos propietarios y en el segundo abiertos. Los archivos de texto, documentos (PDF, Word), imágenes, audio y video, entre otros, son ficheros de información no estructurada.

  • Otros formatos estructurados para representar la información, compartirla e intercambiarla a través de servicios web son RDF, XML y JSON.

La mayoría de los datos se ponen a disposición en formatos reutilizables, es decir, electrónicos, más o menos estructurados, permiten el tratamiento automatizado de la información y, en la medida de lo posible, no son propietarios. Sólo cuando no ha sido posible la publicación en formatos estructurados se presentan en ficheros pdf o enlaces a páginas web (html).

El World Wide Web Consortium (W3C), la comunidad internacional que desarrolla estándares para el crecimiento de la web, recomienda que los datos que se liberen sean útiles y estén en formatos reutilizables.

CSV (Valores Separados por Coma): es un tipo de documento de texto plano para representar datos tabulados en columnas separadas por comas o punto y coma y filas separadas por saltos de línea. Las extensiones que utiliza son 'csv' o 'txt'. Es muy sencillo de utilizar y en muchos casos se exportan los datos de una hoja Excel a formato CSV.

XML (Lenguaje Etiquetado Extensible): es un metalenguaje simple que permite la interpretación de datos para diferentes lenguajes. Es el estándar para el intercambio de información estructurada entre diferentes plataformas. Muchas bases de datos permiten la exportación de sus datos a formato XML.

JSON (JavaScript Object Notation): es un formato ligero para el intercambio de datos basado en la notación literal de objetos de Javascript. Sus ventajas frente a XML son su sintaxis simple, que facilita su tratamiento en los navegadores web, y su concisión, lo que reduce el tamaño del flujo de datos entre cliente y servidor.

RDF (Infraestructura para Descripción de Recursos): es un modelo universal basado en XML que permite intercambiar y enlazar a través de diferentes aplicaciones datos y recursos sin que pierdan su significado, lo que facilita la reutilización y enriquecimiento de los recursos en la Web.

Los datos se presentan identificados y clasificados en conjuntos de datos con el fin de facilitar la indexación. Cada conjunto de datos cuenta con una ficha propia donde se detallan los metadatos que contiene. Todos los conjuntos de datos se agrupan en un catálogo.

Son datos estructurados y enlazados en el marco de la web semántica. Se vinculan los distintos datos que están distribuidos en la Web, de forma que se referencien de la misma forma que lo hacen los enlaces de las páginas web. Utilizan tecnologías RDF, SPARQL, OWL y SKOS. DCAT es el vocabulario RDF diseñado para facilitar la interoperabilidad entre los catálogos de datos.

Guía Breve de Linked Data (W3c Oficina española)
http://www.w3c.es/Divulgacion/GuiasBreves/LinkedData

Repositorio de formatos RDF elaborado por la Fundación Centro Tecnológico de la Información y la Comunicación (CTIC)
http://data.fundacionctic.org/vocab/

Los estándares de interoperabilidad permiten usar, compartir y reutilizar las aplicaciones y sistemas. Estructuran la información de forma coherente dándole un contenido semántico que permita la interoperabilidad entre los sistemas.

Normas Técnicas de Interoperabilidad: catálogo de estándares:
https://administracionelectronica.gob.es/pae_Home/pae_Estrategias/pae_In...

Comisión Europea. ISA2: Interoperability solutions for public administrations, businesses and citizens
https://ec.europa.eu/isa2/home_en

Ejemplos de formatos estandarizados para soporte de iniciativas de datos abiertos:
http://datos.gob.es/es/noticia/rol-y-retos-de-los-estandares-para-datos-...

El concepto Big Data, datos masivos en español, engloba infraestructuras, tecnologías y servicios que han sido creados para dar solución en tiempo real al procesamiento de grandes volúmenes de datos, estructurados y no estructurados que por su elevado volumen, diversidad y complejidad no pueden ser almacenados ni visualizados con herramientas tradicionales. Las dimensiones de estos datos obligan a buscar soluciones tecnológicas para transformar los datos en grandes plataformas Big Data.

La gestión de los Big Data es uno de los puntales de la ciudad inteligente (Smart City), es decir, una ciudad que utiliza las tecnologías de la información y la comunicación para el desarrollo de infraestructuras que garanticen un desarrollo sostenible, mejoren la calidad de vida de los ciudadanos, consigan una mayor eficacia en la distribución de los recursos disponibles e incrementen la participación ciudadana.

Red española de ciudades inteligentes:
http://www.redciudadesinteligentes.es/

Para la sociedad en general que dispone de la información del sector público fácilmente accesible y a la vez se enriquece con los productos y servicios derivados del tratamiento de los datos. La apertura de datos públicos contribuye a crear conocimiento y valor que será compartido por todos en condiciones de igualdad. Una sociedad informada podrá participar en la toma de decisiones de sus gobiernos.

Para las empresas y concretamente para los agentes infomediarios que pueden utilizar los datos para analizarlos, enriquecerlos y crear nuevas aplicaciones, generando con ellos conocimiento, actividad económica, crecimiento y empleo. La mayor parte de los nuevos negocios requieren del acceso a datos, muchos de los cuales son producidos por la Administración pública.

Para la propia Administración, facilitando la interoperabilidad en el intercambio de datos entre las distintas administraciones a la vez puede servir como sistema de ordenación de la información que publican las Administraciones Públicas ya que se presenta identificada y clasificada.

Para potenciar la transparencia administrativa y, con ella, la posibilidad de generar confianza en las instituciones y la exigencia de rendición de cuentas por los ciudadanos.