{"id":52,"date":"2014-11-13T11:35:50","date_gmt":"2014-11-13T10:35:50","guid":{"rendered":"http:\/\/tecnologiasweb.jsenso.es\/?p=52"},"modified":"2014-11-13T11:35:50","modified_gmt":"2014-11-13T10:35:50","slug":"que-es-open-data","status":"publish","type":"post","link":"https:\/\/blogs.ugr.es\/tecweb\/que-es-open-data\/","title":{"rendered":"\u00bfQu\u00e9 es Open Data?"},"content":{"rendered":"<p>El <em>movimiento Open<\/em> engloba desde una forma de entender la difusi\u00f3n de la informaci\u00f3n (tanto en forma documentos, como de software, como de conocimiento) hasta una forma de ver la vida, y todo ello enmarcado dentro de cierto inter\u00e9s hacia el servicio p\u00fablico y el trabajo por la comunidad y el bien com\u00fan.<\/p>\n<p>El <em>Movimiento Open<\/em>, en general, engloba a una serie de actividades que se caracterizan por facilitar la accesibilidad a la informaci\u00f3n y\/o productos, sin condiciones restrictivas y favoreciendo la diseminaci\u00f3n del conocimiento. Dentro de esta corriente encontramos al <em>Open Source <\/em>como primer y principal abanderado de esta filosof\u00eda que, en 1998, incitaba a la creaci\u00f3n de programas inform\u00e1ticos libres, adaptables a las necesidades de cada momento. A partir de ah\u00ed surgieron otras ramificaciones centradas en la promoci\u00f3n del acceso a la documentaci\u00f3n cient\u00edfica (<em>Open Access<\/em>), el fomento en el uso de materiales docentes (<em>OpenCourseWare),<\/em> la reutilizaci\u00f3n de los datos cient\u00edficos y su uso transparente (<em>Open Science)<\/em>, o que una gran empresa comparta sus recursos para que otros socios generen negocios nuevos (<em>Open Business<a id=\"_ftnref1\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn1\" name=\"_ftnref1\"><strong>[1]<\/strong><\/a><\/em>). Y todo ello, articulado por medio de conceptos como Creative Commons<a id=\"_ftnref2\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn2\" name=\"_ftnref2\">[2]<\/a>, Public Domain<a id=\"_ftnref3\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn3\" name=\"_ftnref3\">[3]<\/a> o Public Knowledge<a id=\"_ftnref4\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn4\" name=\"_ftnref4\">[4]<\/a>, sirve de sustento a los cuatro pilares en torno a los que se cimenta el movimiento: Open (entendido como apertura), Free (libre\/libertad), Commons (primar el bien com\u00fan) y Public (car\u00e1cter eminentemente p\u00fablico de las acciones).<\/p>\n<p>Uno de los conceptos desarrollados bajo estas premisas, <em>Open Data <\/em>(OD en adelante), es, posiblemente, el que m\u00e1s impacto est\u00e1 teniendo en la gesti\u00f3n de la informaci\u00f3n, ya que ha logrado calar en administraciones p\u00fablicas de todos los niveles, bibliotecas, empresas, etc. Se trata de datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos al requerimiento de atribuci\u00f3n y de compartirse de la misma manera que aparecen, tal y como explica el <em>Manual de Open Data<\/em><a id=\"_ftnref5\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn5\" name=\"_ftnref5\">[5]<\/a>, uno de los proyectos de la <em>Open Knowledge Foundation<\/em><a id=\"_ftnref6\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn6\" name=\"_ftnref6\">[6]<\/a>, dedicada a promover la creaci\u00f3n de conocimiento y que \u00e9ste se comparta.<\/p>\n<p>La definici\u00f3n de OD implica que los datos deben estar disponibles, lo que conlleva que sean tanto accesibles sin dificultad (preferiblemente en Internet) como no almacenados en formatos propietarios, que obliguen a los usuarios a depender de un software determinado. Adem\u00e1s deben ser reutilizables, lo que supone que se puedan gestionar individualmente, o integrados dentro de otros conjuntos de datos extra\u00eddos de diferentes fuentes. Por \u00faltimo, la distribuci\u00f3n de estos datos debe ser universal, en el sentido m\u00e1s amplio de la palabra. Es decir, que no pueden existir restricciones a personas o instituciones para acceder a dichos datos, ni l\u00edmites impuestos por los programas inform\u00e1ticos empleados, ni usos limitados (educaci\u00f3n o investigaci\u00f3n s\u00f3lo).<\/p>\n<p>Evidentemente en ning\u00fan caso estamos hablando de datos personales. Generalmente, y a partir de la experiencia de lo que se est\u00e1 compartiendo en la actualidad, esos datos est\u00e1n centrados en informaci\u00f3n econ\u00f3mica (volumen de negocios en determinados sectores, el uso del comercio electr\u00f3nico, presupuestos de pa\u00edses, distribuci\u00f3n de gasto\u2026), administraci\u00f3n local o grandes cantidades de informaci\u00f3n (registros de bibliotecas, bases de datos de publicaciones cient\u00edficas\u2026). Una visi\u00f3n bastante acertada de la realidad en el uso de OD lo podemos encontrar en <em>The Web Index<a id=\"_ftnref7\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn7\" name=\"_ftnref7\"><strong>[7]<\/strong><\/a><\/em>, gestionado por la <em>Fundaci\u00f3n<\/em> <em>World Wide Web<\/em><a id=\"_ftnref8\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn8\" name=\"_ftnref8\">[8]<\/a> y que recoge el impacto de determinadas pol\u00edticas en la Web, distribuyendo los datos por pa\u00edses, periodos de tiempo y usos. En concreto, el \u00edndice tiene un apartado denominado \u201capertura de datos en manos de los poderes p\u00fablicos\u201d que eval\u00faa el uso de licencias abiertas por parte de las Administraciones, la transparencia (si los datos \u2013fiscales, de salud, educaci\u00f3n, criminalidad, censo y cartograf\u00eda- se publican convenientemente, si el pa\u00eds en concreto dispone de una pol\u00edtica espec\u00edfica centrada en fomentar el OD, la facilitad del acceso a los datos) y la interactividad con el ciudadano.<\/p>\n<p>&nbsp;<\/p>\n<p align=\"center\"><img decoding=\"async\" src=\"http:\/\/jsenso.es\/sites\/default\/files\/images\/1_01.GIF\" alt=\"Los resultados presentados por The Web Index en octubre de 2012 presentaban un panorama muy activo en lo que a Open Data se refiere a nivel mundial.\" \/><\/p>\n<p align=\"center\">Ilustraci\u00f3n 1. Los resultados presentados por <em>The Web Index<\/em> en octubre de 2012 presentaban un panorama muy activo en lo que a <em>Open Data<\/em> se refiere a nivel mundial.<\/p>\n<p>&nbsp;<\/p>\n<p>La informaci\u00f3n gubernamental ha sido clave en la evoluci\u00f3n de OD. Tanto es as\u00ed que ha facilitado la creaci\u00f3n de un nuevo movimiento, <em>Open Government<\/em> (<em>Gobierno Abierto<\/em> o tambi\u00e9n oGov) que establece una nueva manera de entender la relaci\u00f3n que debe tener la Administraci\u00f3n hacia el exterior (otras Administraciones, empresas, organizaciones) y, muy especialmente, con los ciudadanos. La base del oGov se centra en el siguiente principio: un buen gobierno es aquel que pone a disposici\u00f3n p\u00fablica todos sus datos. Con esto se aumenta en transparencia, fomentado el esp\u00edritu cr\u00edtico y se permitiendo que los administrados puedan crear servicios nuevos a partir de esos datos.<\/p>\n<p>Desde 2009 el Consorcio W3C cuenta con un borrador que explica los principios de actuaci\u00f3n que deben seguir los gobiernos para publicar sus datos<a id=\"_ftnref9\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn9\" name=\"_ftnref9\">[9]<\/a>. Y le presta tanta atenci\u00f3n al tema, que el quinto congreso de la W3C Espa\u00f1a tuvo como principal protagonista el Open Government Data. Tambi\u00e9n cuenta con una secci\u00f3n en su servidor web donde aglutina iniciativas, manuales de buenas pr\u00e1cticas, informaci\u00f3n de congresos, etc<a id=\"_ftnref10\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn10\" name=\"_ftnref10\">[10]<\/a>. Otras instituciones o grupos de inter\u00e9s, como Open Government Data<a id=\"_ftnref11\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn11\" name=\"_ftnref11\">[11]<\/a> o Linking Open Government Data<a id=\"_ftnref12\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn12\" name=\"_ftnref12\">[12]<\/a>, publican continuas actualizaciones sobre el impacto de este modelo de comunicaci\u00f3n administraci\u00f3n\/ciudadano, sirviendo de altavoz a nuevas propuestas, nuevos gobiernos que se unen a esta filosof\u00eda, nuevos cat\u00e1logos de datos disponibles<a id=\"_ftnref13\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn13\" name=\"_ftnref13\">[13]<\/a>, etc.<\/p>\n<p>Es tal la uni\u00f3n entre OD y oGov que en muchas ocasiones se habla de ambos conceptos como sin\u00f3nimos. En realidad esto no es del todo cierto, ya que podr\u00edamos decir que OD es la forma de actuar, y oGov es un ejemplo de actuaci\u00f3n. En cualquier caso, hay una serie de directrices que se deben cumplir para que tenga sentido que los datos, ya sean procedentes de la administraci\u00f3n o de cualquier otra fuente, se compartan. Para empezar, se debe intentar la difusi\u00f3n de la mayor cantidad de datos. Esto est\u00e1 relacionado con lo que se comentaba anteriormente de qu\u00e9 tipo de datos se pueden compartir. En principio, ni los personales, ni aquellos que, por motivos de seguridad o cuestiones legislativas, est\u00e9n regulados por procedimientos de uso privado de la informaci\u00f3n, podr\u00e1n ponerse en abierto. Es importante destacar que los datos no pueden estar sujetos a derechos de autor, ya que esto limitar\u00eda su uso e impondr\u00eda las trabas que se desea superar<a id=\"_ftnref14\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn14\" name=\"_ftnref14\">[14]<\/a>.<\/p>\n<p>Otra de las recomendaciones se centra en la gesti\u00f3n: es fundamental que los datos se publiquen directamente por la fuente que los produce. Generalmente el hecho de que existan intermediarios suele afectar a asuntos relacionados tanto con la confiabilidad de la informaci\u00f3n como con su nivel de detalle. Aspectos ambos que podr\u00edan cuestionar el correcto uso de estos datos. De ah\u00ed precisamente la importancia de contar con cat\u00e1logos de conjuntos de datos publicados (Public Datasec Catalog). Es l\u00f3gico pensar que si es importante cuidar la fuente, no menos lo es el periodo temporal con el que se trabaje. Parece que no tiene mucho sentido que una administraci\u00f3n, o una empresa, publicite datos de hace 10 a\u00f1os. A no ser que el objeto sea realizar estudios afectados por la temporalidad, trabajar con datos pret\u00e9ritos le quita valor a lo publicado.<\/p>\n<p>Una vez que se decide hacer p\u00fablicos unos datos (porque se consideran de inter\u00e9s, porque pueden proporcionar valor a\u00f1adido a otros servicios, por utilidad p\u00fablica, etc.) es preciso que se escoja un sistema que facilite la gesti\u00f3n de esa informaci\u00f3n. Por un lado ser\u00e1 necesario que el formato sea f\u00e1cilmente manipulable, que se pueda indexar. Por otro, que el marco legal empleado para la utilizaci\u00f3n de dichos datos permita su readaptaci\u00f3n y redifusi\u00f3n<a id=\"_ftnref15\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn15\" name=\"_ftnref15\">[15]<\/a>. Lo que se consigue con esto es facilitar la parte <em>Open<\/em> de <em>Open Data<\/em>, es decir, favorecer el trabajo con estos datos por medio de est\u00e1ndares que propicien la interoperabilidad.<\/p>\n<p>Aunque, evidentemente, no se trate de un concepto nuevo, no es menos cierto que la proliferaci\u00f3n en su uso en la literatura \u2013especialmente la inform\u00e1tica- viene casi de la mano de la Web Sem\u00e1ntica. La clave en todo el trabajo relacionado con la Web Sem\u00e1ntica est\u00e1 en hacer las cosas para que se puedan compartir con proyectos similares, de tal forma que el producto de un trabajo no se limita a un \u00e1rea de actuaci\u00f3n concreta, sino que puede ser reutilizado para otras muchas cosas. La interoperabilidad denota la habilidad que poseen los sistemas (no s\u00f3lo inform\u00e1ticos), las personas y las organizaciones por trabajar juntos. En el caso que nos ocupa, esta interoperabilidad ser\u00eda la cualidad de la informaci\u00f3n (los datos) que le otorga la capacidad para ser empleada en diversas bases de datos, o para distintos usos, o en situaciones diferentes. La idea, en esencia, es que diferentes componentes (de nuevo, los datos) creados por organizaciones distintas, puedan integrarse para alcanzar un objetivo concreto.<\/p>\n<p>La manera en la que los datos son representados depende del tipo de formato escogido. Entre los sistemas habituales encontramos a <em>Json<\/em>, <em>XML<\/em>, <em>RDF<\/em> y <em>CSV<\/em>. El primero de ellos, <em>Json<\/em><a id=\"_ftnref16\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn16\" name=\"_ftnref16\">[16]<\/a> (<em>JavaScript<\/em> <em>Object<\/em> <em>Notation<\/em>) es un formato pensado para el intercambio de datos independientemente del lenguaje de programaci\u00f3n con el que se desee trabajar. Es texto plano (de hecho, ocupa menos espacio que el mismo documento en formato <em>XML<\/em>), lo que facilita su escritura, gesti\u00f3n y almacenamiento y, como gran ventaja, no requiere de la utilizaci\u00f3n de parsers para comprobar sint\u00e1cticamente el documento creado. El ejemplo que se muestra a continuaci\u00f3n es una representaci\u00f3n de la informaci\u00f3n de dos libros.<\/p>\n<p>&nbsp;<\/p>\n<table border=\"1\" width=\"325\" cellspacing=\"0\" cellpadding=\"0\">\n<tbody>\n<tr>\n<td>\u2026Var myJSONObject={\u201clibro\u201d:[<\/p>\n<p>{<\/p>\n<p>\u201cautor.nombre\u201d:\u201dCamilo Jos\u00e9\u201d,<\/p>\n<p>\u201cautor.apellidos\u201d:\u201dCela\u201d,<\/p>\n<p>\u201ctitulo\u201d:\u201dLa Colmena\u201d,<\/p>\n<p>\u201cfecha\u201d:\u201d2001\u201d<\/p>\n<p>},<\/p>\n<p>{<\/p>\n<p>\u201cautor.nombre\u201d:\u201dArturo\u201d,<\/p>\n<p>\u201cautor.apellidos\u201d:\u201dPerez Reverte\u201d,<\/p>\n<p>\u201ctitulo\u201d:\u201dEl capit\u00e1n Alatriste\u201d,<\/p>\n<p>\u201cfecha\u201d:\u201d2010\u201d<\/p>\n<p>}<\/p>\n<p>]<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabla 1. Ejemplo de uso de Json<\/p>\n<p>&nbsp;<\/p>\n<p>Como se puede apreciar en el ejemplo, los datos almacenados en Json son f\u00e1cilmente reconocibles y bastante limpios, en el sentido de que no tienen c\u00f3digos o marcas que impidan la r\u00e1pida lectura de la informaci\u00f3n y\/o su procesamiento autom\u00e1tico pero, a cambio, \u00e9sta se encuentra lo suficientemente estructurada como para poder gestionarla de manera eficaz. La estructuraci\u00f3n es tambi\u00e9n la clave del XML. En el ejemplo 2 se puede observar c\u00f3mo ser\u00eda una posible codificaci\u00f3n para los mismos datos en este lenguaje.<\/p>\n<p>&nbsp;<\/p>\n<table border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<tbody>\n<tr>\n<td>&lt;?xml version=\u00bb1.0&#8243; encoding=\u00bbUTF-8&#8243;?&gt;&lt;libro&gt;<\/p>\n<p>&lt;id=\u00bb1&#8243;&gt;<\/p>\n<p>&lt;nombre&gt;Camilo Jos\u00e9&lt;\/nombre&gt;<\/p>\n<p>&lt;apellido&gt;Cela&lt;\/apellido&gt;<\/p>\n<p>&lt;titulo&gt;La colmena&lt;\/titulo&gt;<\/p>\n<p>&lt;fecha&gt;2001&lt;\/fecha&gt;<\/p>\n<p>&lt;\/id&gt;<\/p>\n<p>&lt;id=\u00bb2&#8243;&gt;<\/p>\n<p>&lt;autor&gt;Arturo&lt;\/autor&gt;<\/p>\n<p>&lt;apellido&gt;P\u00e9rez Reverte&lt;\/apellido&gt;<\/p>\n<p>&lt;titulo&gt;El capit\u00e1n Alatriste&lt;\/titulo&gt;<\/p>\n<p>&lt;fecha&gt;2010&lt;\/fecha&gt;<\/p>\n<p>&lt;\/id&gt;<\/p>\n<p>&lt;\/libro&gt;<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabla 2. Ejemplo de uso de XML<\/p>\n<p>&nbsp;<\/p>\n<p>Aunque existen muchas variantes para esta misma descripci\u00f3n<a id=\"_ftnref17\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn17\" name=\"_ftnref17\">[17]<\/a>, el ejemplo es lo suficientemente descriptivo. Aunque la tendencia actual es almacenar la informaci\u00f3n en RDF, que mezcla la flexibilidad del XML con la robustez que le otorga la posibilidad de emplear etiquetas creadas para otros sistemas de descripci\u00f3n de recursos. En el ejemplo 3 se puede observar la codificaci\u00f3n de los mismos datos con los que hemos trabajado en los anteriores ejemplos, pero trabajando junto al sistema de metadatos Dublin Core.<\/p>\n<p>&nbsp;<\/p>\n<table border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<tbody>\n<tr>\n<td>&lt;rdf:Description rdf:about=\u00bb<a href=\"http:\/\/datos.bne.es\/autor\/XX829232.html\" target=\"_blank\">http:\/\/datos.bne.es\/autor\/XX829232.html\u00bb&gt;<\/a>&lt;dc:creator&gt;Camilo Jos\u00e9 Cela&lt;\/dc:creator&gt;<\/p>\n<p>&lt;dc:title&gt;La colmena&lt;\/dc:title&gt;<\/p>\n<p>&lt;dc:date&gt;2001&lt;\/dc:date&gt;<\/p>\n<p>&lt;\/rdf:Description&gt;<\/p>\n<p>&lt;rdf:Description rdf:about=\u00bb<a href=\"http:\/\/datos.bne.es\/autor\/XX955194.html\" target=\"_blank\">http:\/\/datos.bne.es\/autor\/XX955194.html\u00bb&gt;<\/a><\/p>\n<p>&lt;dc:creator&gt;Arturo P\u00e9rez Reverte&lt;\/dc:creator&gt;<\/p>\n<p>&lt;dc:title&gt;El capit\u00e1n Alatriste&lt;\/dc:title&gt;<\/p>\n<p>&lt;dc:date&gt;2010&lt;\/dc:date&gt;<\/p>\n<p>&lt;\/rdf:Description&gt;<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabla 3. Ejemplo de uso de RDF<\/p>\n<p>&nbsp;<\/p>\n<p>CSV (Comma-Separated Values), por \u00faltimo, representa los datos en forma de tabla en la que las columnas se separan por punto y coma y las filas por saltos de l\u00edneas. Dentro del entorno de trabajo OD se suele emplear este formato para documentos contables (presupuestos, hojas de gasto), ya que se puede importar sin muchos problemas y es f\u00e1cilmente procesable por una hoja de c\u00e1lculo.<\/p>\n<p>&nbsp;<\/p>\n<table border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<tbody>\n<tr>\n<td>Nombre;T\u00edtulo;FechaCamilo Jos\u00e9 Cela;La Colmena;2001<\/p>\n<p>Arturo P\u00e9rez Reverte;El capit\u00e1n Alatriste;2010<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabla 4. Ejemplo de uso de CSV<\/p>\n<p>&nbsp;<\/p>\n<p>Otros formatos que se suelen emplear son RSS<a id=\"_ftnref18\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn18\" name=\"_ftnref18\">[18]<\/a>, SHP<a id=\"_ftnref19\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn19\" name=\"_ftnref19\">[19]<\/a>, ODS<a id=\"_ftnref20\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn20\" name=\"_ftnref20\">[20]<\/a> o KML<a id=\"_ftnref21\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn21\" name=\"_ftnref21\">[21]<\/a>. Por supuesto, el formato tambi\u00e9n puede ser propietario, como PDF, Word, XLS (hoja de c\u00e1lculo de Excel), etc.<\/p>\n<p>Una vez liberados los datos en el formato que m\u00e1s interese, tan s\u00f3lo queda hacerlos visibles. Para ello se pueden publicar en una web propia o, lo m\u00e1s recomendable, integrarlos dentro de un cat\u00e1logo central (Dataset Catalog) para que otros puedan usarlos, enlazarlos, vincularlos&#8230;<\/p>\n<p>Aunque en muchas ocasiones la visi\u00f3n europea (y especialmente la espa\u00f1ola) sobre compartir datos p\u00fablicos se centra principalmente en que tambi\u00e9n sean otras instituciones p\u00fablicas las que usen dichos datos, la idea global no se debe circunscribir a eso. En la mayor\u00eda de los casos, los datos que se ponen en abierto han sido generados gracias a que un grupo de personas ha pagado, con sus impuestos, por la creaci\u00f3n de dicha informaci\u00f3n. A partir de ah\u00ed, y una vez abiertos, pueden ser tanto instituciones p\u00fablicas como empresas privadas las que hagan con esos datos lo que deseen. Los norteamericanos, que generalmente suelen ser pioneros en esto de gestionar la informaci\u00f3n, han sido capaces de adoptar y adaptar esta informaci\u00f3n para aportar valor a\u00f1adido a sus productos. Existen cientos de ejemplos, as\u00ed que enumerarlos todos aqu\u00ed supondr\u00eda p\u00e1ginas y p\u00e1ginas de informaci\u00f3n escasamente \u00fatil, as\u00ed que destacaremos s\u00f3lo uno: Trulia<a id=\"_ftnref22\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn22\" name=\"_ftnref22\">[22]<\/a>. Se trata de una inmobiliaria que ofrece sus servicios de alquiler y compra de locales y casas por todo Estados Unidos. Para facilitar a sus clientes tomar la dif\u00edcil decisi\u00f3n de d\u00f3nde ir a vivir han capturado los datos abiertos que ofrece de la Secretar\u00eda de Estado<a id=\"_ftnref23\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn23\" name=\"_ftnref23\">[23]<\/a> y el Departamento de Justicia de los EUA sobre delitos, y con ellos han realizado un mapa que permite, f\u00e1cilmente, conocer cu\u00e1les son las zonas menos conflictivas y, por lo tanto, m\u00e1s propicias para iniciar una nueva vida o negocio. Esta informaci\u00f3n la ofrecen junto a su listado de ofertas, de tal manera que se le aporta al posible cliente la mayor cantidad de datos posibles sobre el emplazamiento escogido.<\/p>\n<p><img decoding=\"async\" src=\"http:\/\/jsenso.es\/sites\/default\/files\/images\/1_02.GIF\" alt=\"Mapa de delitos, distribuido por barrios, del centro de San Francisco. A partir de los datos en bruto ofrecidos por la Administraci\u00f3n americana, la empresa Trulia ofrece un mapa donde se puede obtener informaci\u00f3n detallada del nivel de crimen en cada zona de los Estados Unidos. Se trata de un buen ejemplo de uso de los datos abiertos ofrecidos por la administraci\u00f3n p\u00fablica y gestionados por la empresa privada para aportar valor a\u00f1adido a sus productos. Fuente: http:\/\/www.trulia.com\/crime\/\" \/><\/p>\n<p align=\"center\">Ilustraci\u00f3n 2. Mapa de delitos, distribuido por barrios, del centro de San Francisco. A partir de los datos en bruto ofrecidos por la Administraci\u00f3n americana, la empresa Trulia ofrece un mapa donde se puede obtener informaci\u00f3n detallada del nivel de crimen en cada zona de los Estados Unidos. Se trata de un buen ejemplo de uso de los datos abiertos ofrecidos por la administraci\u00f3n p\u00fablica y gestionados por la empresa privada para aportar valor a\u00f1adido a sus productos. Fuente: <a href=\"http:\/\/www.trulia.com\/crime\/\">http:\/\/www.trulia.com\/crime\/<\/a><\/p>\n<p>&nbsp;<\/p>\n<h2>2.1.- Fuentes de datos<\/h2>\n<p>&nbsp;<\/p>\n<p>Los datos pueden proceder tanto de fuentes p\u00fablicas como de privadas, aunque la tendencia habitual es que sea el \u00e1mbito p\u00fablico el que m\u00e1s informaci\u00f3n genere ya que, tradicionalmente, trabaja con grandes cantidades de datos. Dentro de este apartado se encuentra el oGov, como principal proveedor de datos, a causa de la exigencia, por parte de los ciudadanos, de que la gesti\u00f3n \u2013principalmente econ\u00f3mica- sea cada vez m\u00e1s transparente. Al mismo tiempo, son muchos los gobiernos de diferentes \u00e1mbitos que sienten la necesidad de rendir cuentas a sus administrados sobre qu\u00e9 es lo que se hace con sus impuestos. Pero si ya es importante, y un logro desde el punto de vista de la democracia, este hecho, no lo es menos lo que supone. No hay que ver los datos abiertos como el final de un proceso, sino como el inicio de una cadena: esta difusi\u00f3n de datos se convierte tambi\u00e9n en generadora de riqueza, ya que cualquier persona o empresa podr\u00e1, con esos datos, generar nuevos servicios, productos, tal y como hemos visto anteriormente con el ejemplo de Trulia.<\/p>\n<p>En el \u00e1mbito nacional, la mayor\u00eda de Comunidades Aut\u00f3nomas tienen un dataset con los datos que ofrecen, aunque es evidente que no todas ofrecen la misma cantidad de informaci\u00f3n, ni la misma calidad. Dado que es imposible poner en abierto toda la informaci\u00f3n con la que cuenta la administraci\u00f3n p\u00fablica, lo que habitualmente suelen hacer la Comunidades es establecer prioridades para, en funci\u00f3n del previsible impacto que pueda tener la apertura de unos datos sobre otros, priorizar y dar m\u00e1s difusi\u00f3n a aquellos que puedan tener m\u00e1s repercusi\u00f3n social, o pueda generar nueva riqueza, o puedan aportar luz sobre alg\u00fan aspecto concreto.<\/p>\n<table border=\"1\" cellspacing=\"0\" cellpadding=\"0\">\n<tbody>\n<tr>\n<td>\n<p align=\"center\"><strong>Comunidad Aut\u00f3noma<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"center\">Dataset<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Andaluc\u00eda<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/www.juntadeandalucia.es\/datosabiertos\/portal.html\" target=\"_blank\">http:\/\/www.juntadeandalucia.es\/datosabiertos\/portal.html<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Asturias<\/strong><\/p>\n<\/td>\n<td>http:\/\/risp.asturias.es\/<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Baleares<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/www.caib.es\/caibdatafront\/\" target=\"_blank\">http:\/\/www.caib.es\/caibdatafront\/<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Castilla y Le\u00f3n<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/www.datosabiertos.jcyl.es\/\" target=\"_blank\">http:\/\/www.datosabiertos.jcyl.es\/<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Castilla La Mancha<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/opendata.jccm.es\/\" target=\"_blank\">http:\/\/opendata.jccm.es\/<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Catalu\u00f1a<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/www20.gencat.cat\/portal\/site\/dadesobertes\" target=\"_blank\">http:\/\/www20.gencat.cat\/portal\/site\/dadesobertes<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Extremadura<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/web.archive.org\/web\/20120620115441\/http:\/\/www.extremadurareutiliza.es\/\" target=\"_blank\">http:\/\/www.extremadurareutiliza.es\/<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Galicia<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/abertos.xunta.es\/portada\" target=\"_blank\">http:\/\/abertos.xunta.es\/portada<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Navarra<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/www.navarra.es\/home_es\/Open-Data\/\" target=\"_blank\">http:\/\/www.navarra.es\/home_es\/Open-Data\/<\/a><\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Pa\u00eds Vasco<\/strong><\/p>\n<\/td>\n<td><a href=\"http:\/\/opendata.euskadi.net\" target=\"_blank\">http:\/\/opendata.euskadi.net<\/a><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Tabla 5. Relaci\u00f3n de datasets por Comunidades Aut\u00f3nomas<\/p>\n<p>&nbsp;<\/p>\n<p>Las licencias escogidas por cada Comunidad son variadas, y oscilan entre Creative Commons con reutilizaci\u00f3n comercial hasta derechos de autor m\u00e1s restringidos. A nivel local tambi\u00e9n existen ayuntamientos que publican sus datos, al igual que a nivel estatal, que aglutina toda la informaci\u00f3n en el repositorio ubicado en <a href=\"http:\/\/datos.gob.es\/\" target=\"_blank\">http:\/\/datos.gob.es\/<\/a> aunque, de manera separada, diferentes organismos estatales tienen sus propios conjuntos de datos, como la Biblioteca Nacional<a id=\"_ftnref24\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn24\" name=\"_ftnref24\">[24]<\/a>,<\/p>\n<p>El caso espa\u00f1ol es paradigm\u00e1tico, ya que se produce algo muy frecuente dentro del mundo OD: la falta de normalizaci\u00f3n. En Espa\u00f1a cada Comunidad Aut\u00f3noma ha optado por un tipo de formato diferente para publicar sus datos, una licencia de uso distinta e, incluso en algunos casos, no permitir realizar procesos automatizados con los datos ofrecidos. Pensamos que la tendencia deber\u00eda ser optar por la normalizaci\u00f3n global, tanto de formatos como de licencias y usos, dentro de las administraciones p\u00fablicas. Todo eso se consigue con un mayor nivel de coordinaci\u00f3n, que se puede conseguir por medio de una normativa global consensuada con todas las partes implicadas. De esa manera el camino para compartir presenta menos obst\u00e1culos y se sirve mejor a los intereses que propiciaron este movimiento.<\/p>\n<p>El segundo grupo de fuentes de datos procede del sector privado, incluyendo tanto a entidades sin \u00e1nimo de lucro, como empresas comerciales. Sus datos son exactamente igual de fiables que los de cualquier administraci\u00f3n p\u00fablica pero, en la mayor\u00eda de ocasiones, son menos voluminosos o con menos nivel de detalle. A nivel internacional destaca, por ejemplo, el Banco Mundial<a id=\"_ftnref25\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn25\" name=\"_ftnref25\">[25]<\/a> que ofrece, agrupado en 18 temas (desde agricultura hasta sector financiero, energ\u00eda, educaci\u00f3n, etc.) m\u00e1s de 2000 indicadores diferentes para analizar diversos aspectos de estas \u00e1reas tem\u00e1ticas.<\/p>\n<p>Si lo que se busca es informaci\u00f3n empresarial, lo mejor es acudir a Open Corporates<a id=\"_ftnref26\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn26\" name=\"_ftnref26\">[26]<\/a>, repositorio que recoge informaci\u00f3n sobre m\u00e1s de 50 millones de empresas de todo el mundo que comparte este tipo de informaci\u00f3n. Las compa\u00f1\u00edas, agrupadas por pa\u00edses, ofrecen sus datos por medio de una API<a id=\"_ftnref27\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn27\" name=\"_ftnref27\">[27]<\/a> o de un widget<a id=\"_ftnref28\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn28\" name=\"_ftnref28\">[28]<\/a>.<\/p>\n<p>Pero la fuente privada m\u00e1s empleada en todo el mundo es, sin duda alguna, la DBpedia<a id=\"_ftnref29\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn29\" name=\"_ftnref29\">[29]<\/a>. Esta iniciativa surgi\u00f3 en 2007 gracias a la colaboraci\u00f3n entre la Free University of Berlin<a id=\"_ftnref30\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn30\" name=\"_ftnref30\">[30]<\/a> y OpenLink Software<a id=\"_ftnref31\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn31\" name=\"_ftnref31\">[31]<\/a> con la idea de extraer informaci\u00f3n estructurada de la Wikipedia<a id=\"_ftnref32\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn32\" name=\"_ftnref32\">[32]<\/a> para publicarla de forma abierta. Realmente este tipo de publicaci\u00f3n es ya un cl\u00e1sico ejemplo de gesti\u00f3n de Big Data<a id=\"_ftnref33\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn33\" name=\"_ftnref33\">[33]<\/a>, pero a\u00f1adiendo varias peculiaridades, como son la versatilidad (el car\u00e1cter enciclop\u00e9dico de la Wikipedia hace que la informaci\u00f3n sea multidisciplinar y en muchos formatos, tales como biograf\u00edas, definiciones, relaci\u00f3n entre conceptos\u2026) y la reutilizaci\u00f3n (ese tratamiento de la informaci\u00f3n tienes una finalidad: que se pueda reutilizar en muchos proyectos\/programas diferentes).<\/p>\n<p>La DBpedia aprovecha la informaci\u00f3n estructurada que ofrece la Wikipedia, usando sus categor\u00edas, im\u00e1genes, hiperv\u00ednculos, coordenadas geogr\u00e1ficas, los infoboxes<a id=\"_ftnref34\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn34\" name=\"_ftnref34\">[34]<\/a>, etc. a los que se accede por medio de m\u00f3dulos de acceso para Sparql Endpoints (se explicar\u00e1 m\u00e1s adelante) y distintos interfaces. Adquirir la informaci\u00f3n de esta fuente conlleva que tambi\u00e9n se empleen sus mecanismos para las inconsistencias, el tratamiento de la ambig\u00fcedad de t\u00e9rminos y la posibilidad de gestionar el conocimiento que, impl\u00edcitamente, se encuentra plasmado en esta fuente. Evidentemente, tambi\u00e9n se heredan sus errores: temas muy desarrollados frente a otros tratados con menos profundidad, actos vand\u00e1licos que acarrean informaci\u00f3n err\u00f3nea, entradas con claros objetivos publicitarios, etc.<\/p>\n<p>&nbsp;<\/p>\n<h2>2.2.- Ejemplo de uso<\/h2>\n<p>&nbsp;<\/p>\n<p>Existen gran cantidad de sitios web que emplean datos liberados como base para alimentar sus aplicaciones, posiblemente m\u00e1s de los que pensemos. Una vez que los datos se integran en los sitios web forman parte de \u00e9stos, aportando valor a la informaci\u00f3n que se ofrece. Y en muchas ocasiones es esa integraci\u00f3n la que nos permite darnos cuenta de la procedencia de los datos.<\/p>\n<p>Abrelibros<a id=\"_ftnref35\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn35\" name=\"_ftnref35\">[35]<\/a> emplea la informaci\u00f3n proporcionada por las Bibliotecas P\u00fablicas de la Comunidad de Madrid para proporcionar un servicio de alerta cada vez que un libro marcado como favorito se encuentra disponible para su pr\u00e9stamo. En muchos pa\u00edses se emplean los datos proporcionados por el Ministerio de Econom\u00eda correspondiente para hacer comparativas sobre el gasto presupuestario<a id=\"_ftnref36\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn36\" name=\"_ftnref36\">[36]<\/a>. Repostator<a id=\"_ftnref37\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn37\" name=\"_ftnref37\">[37]<\/a> localiza en un mapa las gasolineras espa\u00f1olas indicando el precio del carburante publicado por el Ministerio de Industria, Energ\u00eda y Turismo de Espa\u00f1a&#8230; El listado de p\u00e1ginas web y aplicaciones es inmenso.<\/p>\n<p>Como se ha mostrado al final del apartado 2, los datos se pueden ofrecer en m\u00faltiples formatos. Dependiendo del tipo de formato, el procesado de la informaci\u00f3n podr\u00e1 ser m\u00e1s o menos automatizable. En el caso de encontrarnos con informaci\u00f3n en html o csv (los m\u00e1s habituales dentro de la administraci\u00f3n p\u00fablica), cualquier hoja de c\u00e1lculo nos permitir\u00e1, por medio de simples f\u00f3rmulas, extraer la informaci\u00f3n para poder integrarla en cualquier documento. Si, por el contrario, los datos aparecen en formatos menos manipulables (pdf, Word, etc.) habr\u00e1 que emplear t\u00e9cnicas m\u00e1s sofisticadas. Aunque en este caso siempre se podr\u00e1n utilizar soluciones propuestas por otras personas. En este sentido, ScraperWiki<a id=\"_ftnref38\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn38\" name=\"_ftnref38\">[38]<\/a>, que recoge c\u00f3digos aportados de manera gratuita por diferentes desarrolladores para capturar datos con estas caracter\u00edsticas, puede ser una soluci\u00f3n. Las t\u00e9cnicas de scraping<a id=\"_ftnref39\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn39\" name=\"_ftnref39\">[39]<\/a> son muy socorridas ante este tipo de problemas.<\/p>\n<p>Si, por ejemplo, los datos se han compartido en formato RSS, una de las soluciones m\u00e1s empleadas es el uso de Yahoo Pipes<a id=\"_ftnref40\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn40\" name=\"_ftnref40\">[40]<\/a>. Se trata de una aplicaci\u00f3n web gratuita que sirve para procesar, mezclar, manipular o filtrar uno o varios canales de informaci\u00f3n en RSS con el objeto de crear un \u00fanico canal RSS que contenga la informaci\u00f3n que m\u00e1s nos interese de los canales escogidos. B\u00e1sicamente permite seleccionar varios RSS y manipularlos, por medio de diversas reglas y filtros, para generar un RSS derivado de ellos.<\/p>\n<p>Este sistema es realmente \u00fatil y presenta varias ventajas, como poder filtrar los datos que se desea mostrar, seleccionar m\u00e1s de una fuente de datos para generar una \u00fanica salida, ordenarlos en funci\u00f3n a diferentes criterios, incluir un mapa si el RSS contiene datos de geolocalizaci\u00f3n y, por \u00faltimo, contar con una URL donde se pueda consultar el producto resultante. Dicha URL est\u00e1 preparada para ser compartida en WordPress, Bloger o incluso embeber en cualquier otro sistema. EL principal inconveniente: que el formato RSS no es el mayoritario a la hora de compartir OD, con lo que su uso es muy limitado.<\/p>\n<p>Si los datos se comparten en cualquier otro formato, o bien podemos gestionarlos directamente para integrarlos en el sitio web que m\u00e1s interese, o se pueden emplear aplicaciones concretas. Realmente hay poco software que, de manera espec\u00edfica, se dedique a la captura y reutilizaci\u00f3n de datos. En la mayor\u00eda de los casos son entornos de trabajo globales que, aunque tambi\u00e9n sirven para ese prop\u00f3sito, resultan complejos de gestionar si el objeto que se persigue es tan s\u00f3lo capturar datos para reutilizarlos. De este grupo de programas destaca CKAN<a id=\"_ftnref41\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn41\" name=\"_ftnref41\">[41]<\/a> (herramienta open source que permite publicar, compartir y reutilizar datos de cualquier origen), Open Data Kit<a id=\"_ftnref42\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn42\" name=\"_ftnref42\">[42]<\/a> (se trata de un conjunto de herramientas open source que facilita el proceso de construcci\u00f3n de una colecci\u00f3n de datos, gestionarlos y agregarlos a servidores en diferentes formatos) o Talend<a id=\"_ftnref43\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn43\" name=\"_ftnref43\">[43]<\/a> (pensado principalmente para la gesti\u00f3n de big data).<\/p>\n<p>Para practicar un poco vamos a escoger Tablets<a id=\"_ftnref44\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn44\" name=\"_ftnref44\">[44]<\/a> (Tabular Cells). Es una herramienta que sirve para tratar datos con formato tabular, tales como Excel, OpenOffice, tablas en HTML, ficheros CVS, ficheros de an\u00e1lisis estad\u00edstico PX, o ficheros de intercambio de informaci\u00f3n geogr\u00e1fica (ESRI). Est\u00e1 desarrollada por la Fundaci\u00f3n CTIC<a id=\"_ftnref45\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn45\" name=\"_ftnref45\">[45]<\/a>\u00a0 puede probar de forma gratuita y que se puede probar de manera gratuita desde mediados de noviembre de 2012.<\/p>\n<p>La gran ventaja de esta herramienta es que, adem\u00e1s de permitir la transformaci\u00f3n de datos, ofrece vistas para trabajar con los datos que se han procesado por medio de gr\u00e1ficos estad\u00edsticos, mapas interactivos, vistas facetadas, Sparql endpoint<a id=\"_ftnref46\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn46\" name=\"_ftnref46\">[46]<\/a> o servicios REST<a id=\"_ftnref47\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftn47\" name=\"_ftnref47\">[47]<\/a>. El gran inconveniente: que los datos se quedan almacenados en el servidor de Tabels, no pudiendo ser exportados para ser integrados en otros servicios, tal y como s\u00ed ocurr\u00eda con Yahoo Pipes, por ejemplo.<\/p>\n<div><\/div>\n<hr align=\"left\" size=\"1\" width=\"33%\" \/>\n<div id=\"ftn1\">\n<p><a id=\"_ftn1\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref1\" name=\"_ftn1\">[1]<\/a> Open business Una gran empresa comparte sus recursos para que otros socios generen negocios nuevos. Ejemplo cl\u00e1sico de esto es Amazon, que permite que cualquiera anuncie productos de esta empresa norteamericana en sus blogs o p\u00e1ginas web personales a cambio de una comisi\u00f3n si alguien ha adquirido un producto concreto pinchando en el enlace que aparece en dicho blog o p\u00e1gina web (<a href=\"https:\/\/afiliados.amazon.es\/\">https:\/\/afiliados.amazon.es\/<\/a>).<\/p>\n<\/div>\n<div id=\"ftn2\">\n<p><a id=\"_ftn2\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref2\" name=\"_ftn2\">[2]<\/a> Corporaci\u00f3n sin \u00e1nimo de lucro orientado a otorgar al autor el poder de decidir los l\u00edmites de uso y explotaci\u00f3n de su trabajo.<\/p>\n<\/div>\n<div id=\"ftn3\">\n<p><a id=\"_ftn3\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref3\" name=\"_ftn3\">[3]<\/a> Conjunto de bienes y derechos de titularidad p\u00fablica destinados al uso y\/o servicios p\u00fablico.<\/p>\n<\/div>\n<div id=\"ftn4\">\n<p><a id=\"_ftn4\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref4\" name=\"_ftn4\">[4]<\/a> Iniciativa enfocada en potenciar la importancia de hacer los resultados de las investigaciones p\u00fablicas y gratuitas, buscando mejorar la calidad de la investigaci\u00f3n por medio del desarrollo del trabajo colaborativo.<\/p>\n<\/div>\n<div id=\"ftn5\">\n<p><a id=\"_ftn5\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref5\" name=\"_ftn5\">[5]<\/a> <a href=\"http:\/\/opendatahandbook.org\" target=\"_blank\">http:\/\/opendatahandbook.org<\/a><\/p>\n<\/div>\n<div id=\"ftn6\">\n<p><a id=\"_ftn6\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref6\" name=\"_ftn6\">[6]<\/a> <a href=\"http:\/\/okfn.org\" target=\"_blank\">http:\/\/okfn.org<\/a><\/p>\n<\/div>\n<div id=\"ftn7\">\n<p><a id=\"_ftn7\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref7\" name=\"_ftn7\">[7]<\/a> <a href=\"http:\/\/thewebindex.org\" target=\"_blank\">http:\/\/thewebindex.org<\/a><\/p>\n<\/div>\n<div id=\"ftn8\">\n<p><a id=\"_ftn8\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref8\" name=\"_ftn8\">[8]<\/a> <a href=\"http:\/\/www.webfoundation.org\/\" target=\"_blank\">http:\/\/www.webfoundation.org\/<\/a> No confundir con el Consorcio World Wide Web (W3C)<\/p>\n<\/div>\n<div id=\"ftn9\">\n<p><a id=\"_ftn9\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref9\" name=\"_ftn9\">[9]<\/a> <a href=\"http:\/\/www.w3.org\/TR\/gov-data\/\" target=\"_blank\">http:\/\/www.w3.org\/TR\/gov-data\/<\/a><\/p>\n<\/div>\n<div id=\"ftn10\">\n<p><a id=\"_ftn10\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref10\" name=\"_ftn10\">[10]<\/a> <a href=\"http:\/\/www.w3.org\/egov\/\" target=\"_blank\">http:\/\/www.w3.org\/egov\/<\/a><\/p>\n<\/div>\n<div id=\"ftn11\">\n<p><a id=\"_ftn11\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref11\" name=\"_ftn11\">[11]<\/a> <a href=\"http:\/\/opengovernmentdata.org\/\" target=\"_blank\">http:\/\/opengovernmentdata.org\/<\/a><\/p>\n<\/div>\n<div id=\"ftn12\">\n<p><a id=\"_ftn12\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref12\" name=\"_ftn12\">[12]<\/a> <a href=\"http:\/\/logd.tw.rpi.edu\/\" target=\"_blank\">http:\/\/logd.tw.rpi.edu\/<\/a><\/p>\n<\/div>\n<div id=\"ftn13\">\n<p><a id=\"_ftn13\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref13\" name=\"_ftn13\">[13]<\/a> Tambi\u00e9n conocido como Public Dataset Catalog. Se trata de bases de datos que recopilan informaci\u00f3n sobre d\u00f3nde se encuentran los datos que cada administraci\u00f3n hace p\u00fablicos, en qu\u00e9 formato, qu\u00e9 tipo de informaci\u00f3n se puede encontrar, etc. Entre los m\u00e1s importantes y actualizados destacamos tres. Por un lado el cat\u00e1logo de la Fundaci\u00f3n CTIC (<a href=\"http:\/\/datos.fundacionctic.org\/sandbox\/catalog\/faceted\/\" target=\"_blank\">http:\/\/datos.fundacionctic.org\/sandbox\/catalog\/faceted\/<\/a>), el de TWC LOGD (<a href=\"http:\/\/logd.tw.rpi.edu\/demo\/international_dataset_catalog_search\" target=\"_blank\">http:\/\/logd.tw.rpi.edu\/demo\/international_dataset_catalog_search<\/a>) y el de <em>the Data Hub<\/em> (<a href=\"http:\/\/thedatahub.org\/es\/\" target=\"_blank\">http:\/\/thedatahub.org\/es\/<\/a>).<\/p>\n<\/div>\n<div id=\"ftn14\">\n<p><a id=\"_ftn14\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref14\" name=\"_ftn14\">[14]<\/a> En este sentido hay que recordar que lo recomendable es publicitar los datos abiertos bajo alg\u00fan tipo de licencia encargada de gestionar los derechos de autor. De esa manera queda claro cu\u00e1l es el alcance del uso de esa informaci\u00f3n, liberando a la organizaci\u00f3n que ha creado esos datos de posibles problemas. Una revisi\u00f3n bastante completa del tipo y alcance de licencias se puede encontrar en la p\u00e1gina web de <em>Open Definition<\/em>, con un listado (<a href=\"http:\/\/opendefinition.org\/licenses\/\" target=\"_blank\">http:\/\/opendefinition.org\/licenses\/<\/a>) y una gu\u00eda de uso (<a href=\"http:\/\/opendefinition.org\/guide\/data\/\" target=\"_blank\">http:\/\/opendefinition.org\/guide\/data\/<\/a>).<\/p>\n<\/div>\n<div id=\"ftn15\">\n<p><a id=\"_ftn15\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref15\" name=\"_ftn15\">[15]<\/a> Un sistema muy habitual suele ser el empleo de licencias Creative Commons, en cualquiera de sus variedades. En <a href=\"http:\/\/creativecommons.org\/choose\/\" target=\"_blank\">http:\/\/creativecommons.org\/choose\/<\/a>, y por medio de un sencillo cuestionario, orientan a los usuarios sobre cu\u00e1l es la mejor opci\u00f3n de licencia en funci\u00f3n de lo que se desee hacer con los datos.<\/p>\n<\/div>\n<div id=\"ftn16\">\n<p><a id=\"_ftn16\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref16\" name=\"_ftn16\">[16]<\/a> Viene definido por la RFC 4627 (<a href=\"http:\/\/www.ietf.org\/rfc\/rfc4627.txt\" target=\"_blank\">http:\/\/www.ietf.org\/rfc\/rfc4627.txt<\/a>)<\/p>\n<\/div>\n<div id=\"ftn17\">\n<p><a id=\"_ftn17\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref17\" name=\"_ftn17\">[17]<\/a> Se podr\u00eda poner una etiqueta de autor que incluyera las subetiquetas de nombre y apellido. El campo de fecha podr\u00eda ser una etiqueta vac\u00eda\u2026<\/p>\n<\/div>\n<div id=\"ftn18\">\n<p><a id=\"_ftn18\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref18\" name=\"_ftn18\">[18]<\/a> RSS (Really Symple Sindication), formato XML para la distribuci\u00f3n de contenidos de p\u00e1ginas web. Facilita la publicaci\u00f3n de informaci\u00f3n actualizada a los usuarios suscritos a la fuente RSS sin necesidad de usar un navegador.<\/p>\n<\/div>\n<div id=\"ftn19\">\n<p><a id=\"_ftn19\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref19\" name=\"_ftn19\">[19]<\/a> SHP (Shapefile), formato propietario est\u00e1ndar de datos espaciales, desarrollado por la compa\u00f1\u00eda ESRI, que almacena tanto la geometr\u00eda como la informaci\u00f3n alfanum\u00e9rica. Este formato no est\u00e1 preparado para almacenar informaci\u00f3n topol\u00f3gica.<\/p>\n<\/div>\n<div id=\"ftn20\">\n<p><a id=\"_ftn20\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref20\" name=\"_ftn20\">[20]<\/a> ODS (Operational Data Store). Es un contenedor de datos activos, es decir datos que ayudan al soporte de decisiones y a la operaci\u00f3n. Es un formato de archivo abierto y est\u00e1ndar para el almacenamiento de hojas de c\u00e1lculo que muestra informaci\u00f3n en celdas organizadas en filas y columnas, y cada celda contiene datos o f\u00f3rmulas, con referencias relativas o absolutas a otras celdas.<\/p>\n<\/div>\n<div id=\"ftn21\">\n<p><a id=\"_ftn21\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref21\" name=\"_ftn21\">[21]<\/a> KML (Keyhole Markup Language). Es una gram\u00e1tica XML y un formato de archivo para la creaci\u00f3n de modelos y el almacenamiento de funciones geogr\u00e1ficas como puntos, l\u00edneas, im\u00e1genes, pol\u00edgonos y modelos que se mostrar\u00e1n principalmente en aplicaciones de mapas. KML es utilizado para compartir lugares e informaci\u00f3n entre aplicaciones.<\/p>\n<\/div>\n<div id=\"ftn22\">\n<p><a id=\"_ftn22\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref22\" name=\"_ftn22\">[22]<\/a> <a href=\"http:\/\/www.trulia.com\" target=\"_blank\">http:\/\/www.trulia.com<\/a><\/p>\n<\/div>\n<div id=\"ftn23\">\n<p><a id=\"_ftn23\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref23\" name=\"_ftn23\">[23]<\/a> Todos los datos abiertos ofrecidos por el gobierno norteamericanos se encuentran centralizados en el dataset ubicado en: <a href=\"https:\/\/explore.data.gov\/\">https:\/\/explore.data.gov\/<\/a><\/p>\n<\/div>\n<div id=\"ftn24\">\n<p><a id=\"_ftn24\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref24\" name=\"_ftn24\">[24]<\/a> <a href=\"http:\/\/datos.bne.es\">http:\/\/datos.bne.es<\/a><\/p>\n<\/div>\n<div id=\"ftn25\">\n<p><a id=\"_ftn25\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref25\" name=\"_ftn25\">[25]<\/a> <a href=\"http:\/\/datos.bancomundial.org\/catalogo-de-datos\" target=\"_blank\">http:\/\/datos.bancomundial.org\/catalogo-de-datos<\/a><\/p>\n<\/div>\n<div id=\"ftn26\">\n<p><a id=\"_ftn26\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref26\" name=\"_ftn26\">[26]<\/a> <a href=\"http:\/\/opencorporates.com\/\" target=\"_blank\">http:\/\/opencorporates.com\/<\/a><\/p>\n<\/div>\n<div id=\"ftn27\">\n<p><a id=\"_ftn27\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref27\" name=\"_ftn27\">[27]<\/a> Interfaz para la Programaci\u00f3n de Aplicaciones<\/p>\n<\/div>\n<div id=\"ftn28\">\n<p><a id=\"_ftn28\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref28\" name=\"_ftn28\">[28]<\/a> Peque\u00f1os trozos de c\u00f3digo fuente que se insertan en una p\u00e1gina web y permiten interactuar desde ah\u00ed con el servicio que proporciona los datos.<\/p>\n<\/div>\n<div id=\"ftn29\">\n<p><a id=\"_ftn29\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref29\" name=\"_ftn29\">[29]<\/a> <a href=\"http:\/\/dbpedia.org\" target=\"_blank\">http:\/\/dbpedia.org<\/a> cuenta desde mediados de 2012 con su versi\u00f3n en espa\u00f1ol en: <a href=\"http:\/\/es.dbpedia.org\" target=\"_blank\">http:\/\/es.dbpedia.org<\/a><\/p>\n<\/div>\n<div id=\"ftn30\">\n<p><a id=\"_ftn30\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref30\" name=\"_ftn30\">[30]<\/a> <a href=\"http:\/\/www.fu-berlin.de\/en\/\" target=\"_blank\">http:\/\/www.fu-berlin.de\/en\/<\/a><\/p>\n<\/div>\n<div id=\"ftn31\">\n<p><a id=\"_ftn31\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref31\" name=\"_ftn31\">[31]<\/a> <a href=\"http:\/\/www.openlinksw.com\/\" target=\"_blank\">http:\/\/www.openlinksw.com\/<\/a><\/p>\n<\/div>\n<div id=\"ftn32\">\n<p><a id=\"_ftn32\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref32\" name=\"_ftn32\">[32]<\/a> La Wikipedia se enmarca dentro del modelo de trabajo definido como Crowdsourcing basado en la Web, es decir, un producto creado por una multitud (crowd) que tiene un objetivo com\u00fan. Aunque no es habitual dentro del mundo OD, s\u00ed existen iniciativas que generan datos a partir del trabajo colectivo de muchas personas. <a href=\"http:\/\/www.wikipedia.org\" target=\"_blank\">http:\/\/www.wikipedia.org<\/a>. Otro ejemplo de este tipo de creaci\u00f3n es MusicBrainz (<a href=\"http:\/\/musicbrainz.org\/\" target=\"_blank\">http:\/\/musicbrainz.org\/<\/a>).<\/p>\n<\/div>\n<div id=\"ftn33\">\n<p><a id=\"_ftn33\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref33\" name=\"_ftn33\">[33]<\/a> Tratamiento y an\u00e1lisis de repositorios formados por cantidades enormes de datos. Precisamente esa inmensa cantidad de datos hace que sea dif\u00edcil su gesti\u00f3n y procesamiento.<\/p>\n<\/div>\n<div id=\"ftn34\">\n<p><a id=\"_ftn34\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref34\" name=\"_ftn34\">[34]<\/a> Peque\u00f1os recuadros informativos que se insertan en cualquier parte de una entrada de la Wikipedia con el fin de a\u00f1adir alguna informaci\u00f3n relacionada con la entrada principal pero sin romper la ret\u00f3rica da la explicaci\u00f3n principal.<\/p>\n<\/div>\n<div id=\"ftn35\">\n<p><a id=\"_ftn35\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref35\" name=\"_ftn35\">[35]<\/a> <a href=\"http:\/\/web.archive.org\/web\/20130405050916\/http:\/\/abrelibros.tecnilogica.com:80\/\" target=\"_blank\">http:\/\/abrelibros.tecnilogica.com\/<\/a><\/p>\n<\/div>\n<div id=\"ftn36\">\n<p><a id=\"_ftn36\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref36\" name=\"_ftn36\">[36]<\/a> Para Espa\u00f1a: <a href=\"http:\/\/dondevanmisimpuestos.es\/\" target=\"_blank\">http:\/\/dondevanmisimpuestos.es\/<\/a>, en el Reino Unido: <a href=\"http:\/\/wheredoesmymoneygo.org\/\" target=\"_blank\">http:\/\/wheredoesmymoneygo.org\/<\/a>&#8230; En general OpenSpending recoge la mayor\u00eda de iniciativas (a nivel mundial <a href=\"http:\/\/openspending.org\/\" target=\"_blank\">http:\/\/openspending.org\/<\/a>).<\/p>\n<\/div>\n<div id=\"ftn37\">\n<p><a id=\"_ftn37\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref37\" name=\"_ftn37\">[37]<\/a> <a href=\"http:\/\/repostator.com\/\" target=\"_blank\">http:\/\/repostator.com\/<\/a><\/p>\n<\/div>\n<div id=\"ftn38\">\n<p><a id=\"_ftn38\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref38\" name=\"_ftn38\">[38]<\/a> <a href=\"https:\/\/scraperwiki.com\/\" target=\"_blank\">https:\/\/scraperwiki.com\/<\/a><\/p>\n<\/div>\n<div id=\"ftn39\">\n<p><a id=\"_ftn39\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref39\" name=\"_ftn39\">[39]<\/a> Data Scraping es una t\u00e9cnica de programaci\u00f3n que permite capturar los datos incluidos en una aplicaci\u00f3n. Su variante m\u00e1s empleada, el Screen Scraping, es una t\u00e9cnica que se usa para la extracci\u00f3n autom\u00e1tica de texto, obviando la informaci\u00f3n binaria (im\u00e1genes, multimedia, etc.). Los scrapers son programas capaces de trabajar con cualquier texto para procesarlo y estructurarlo. De hecho, son muy empleados por los buscadores de internet como anexo al trabajo realizado por sus ara\u00f1as. Scroogle (<a href=\"http:\/\/www.scroogle.org\/\" target=\"_blank\">http:\/\/www.scroogle.org\/<\/a>), por ejemplo, utilizaba esta t\u00e9cnica para hacer b\u00fasquedas en Google sin que salgan los molestos anuncios alrededor de los resultados hasta que fue bloqueado por el buscador para impedir este servicio. El navegador sem\u00e1ntico Piggy Bank emplea tambi\u00e9n estas t\u00e9cnicas para facilitar el proceso de etiquetado de informaci\u00f3n sem\u00e1ntica de sitios web (<a href=\"http:\/\/simile.mit.edu\/papers\/iswc05.pdf\" target=\"_blank\">http:\/\/simile.mit.edu\/wiki\/Piggy_Bank<\/a>).<\/p>\n<\/div>\n<div id=\"ftn40\">\n<p><a id=\"_ftn40\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref40\" name=\"_ftn40\">[40]<\/a> <a href=\"http:\/\/pipes.yahoo.com\/pipes\/\" target=\"_blank\">http:\/\/pipes.yahoo.com\/pipes\/<\/a><\/p>\n<\/div>\n<div id=\"ftn41\">\n<p><a id=\"_ftn41\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref41\" name=\"_ftn41\">[41]<\/a> <a href=\"http:\/\/ckan.org\/\" target=\"_blank\">http:\/\/ckan.org\/<\/a><\/p>\n<\/div>\n<div id=\"ftn42\">\n<p><a id=\"_ftn42\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref42\" name=\"_ftn42\">[42]<\/a> <a href=\"http:\/\/opendatakit.org\/\" target=\"_blank\">http:\/\/opendatakit.org\/<\/a><\/p>\n<\/div>\n<div id=\"ftn43\">\n<p><a id=\"_ftn43\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref43\" name=\"_ftn43\">[43]<\/a> <a href=\"http:\/\/www.talend.com\/\" target=\"_blank\">http:\/\/www.talend.com\/<\/a><\/p>\n<\/div>\n<div id=\"ftn44\">\n<p><a id=\"_ftn44\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref44\" name=\"_ftn44\">[44]<\/a> <a href=\"http:\/\/idi.fundacionctic.org\/tabels\/\" target=\"_blank\">http:\/\/idi.fundacionctic.org\/tabels\/<\/a><\/p>\n<\/div>\n<div id=\"ftn45\">\n<p><a id=\"_ftn45\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref45\" name=\"_ftn45\">[45]<\/a> <a href=\"http:\/\/www.fundacionctic.org\" target=\"_blank\">http:\/\/www.fundacionctic.org<\/a><\/p>\n<\/div>\n<div id=\"ftn46\">\n<p><a id=\"_ftn46\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref46\" name=\"_ftn46\">[46]<\/a> Sparql (Protocol and RDF Query Language) es un lenguaje de consulta para consultar bases de datos que almacenan la informaci\u00f3n en formato RDF. Los endpoints de Sparql son URI a las que se env\u00edan las peticiones (generalmente consultas, pero tambi\u00e9n pueden ser actualizaciones, listados, etc.) a realizar en la base de datos.<\/p>\n<\/div>\n<div id=\"ftn47\">\n<p><a id=\"_ftn47\" title=\"\" href=\"http:\/\/jsenso.es\/node\/256#_ftnref47\" name=\"_ftn47\">[47]<\/a> REST (Representational State Transfer) es una arquitectura que se emplea para la creaci\u00f3n de programas en el que los clientes pueden efectuar peticiones de servicios a los servidores. Es una forma de implementar la arquitectura cliente-servidor.<\/p>\n<\/div>\n","protected":false},"excerpt":{"rendered":"<p>El movimiento Open engloba desde una forma de entender la difusi\u00f3n de la informaci\u00f3n (tanto en forma documentos, como de software, como de conocimiento) hasta una forma de ver la vida, y todo ello enmarcado dentro de cierto inter\u00e9s hacia el servicio p\u00fablico y el trabajo por la comunidad y el bien com\u00fan. El Movimiento [&hellip;]<\/p>\n","protected":false},"author":65,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_genesis_hide_title":false,"_genesis_hide_breadcrumbs":false,"_genesis_hide_singular_image":false,"_genesis_hide_footer_widgets":false,"_genesis_custom_body_class":"","_genesis_custom_post_class":"","_genesis_layout":"","footnotes":""},"categories":[21],"tags":[22],"class_list":{"0":"post-52","1":"post","2":"type-post","3":"status-publish","4":"format-standard","6":"category-la-word-wide-web","7":"tag-open-data","8":"entry"},"_links":{"self":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/posts\/52","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/users\/65"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/comments?post=52"}],"version-history":[{"count":0,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/posts\/52\/revisions"}],"wp:attachment":[{"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/media?parent=52"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/categories?post=52"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.ugr.es\/tecweb\/wp-json\/wp\/v2\/tags?post=52"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}