
Esta es la decimoctava conversación del proyecto 100+ Conversaciones para Inspirar Nuestra Nueva Dirección (#OKFN100).
Desde 2023, nos estamos reuniendo con más de 100 personas para discutir el futuro del conocimiento abierto, moldeado por un conjunto diverso de visiones de artistas, activistas, académicos, archivistas, pensadores, legisladores, científicos de datos, educadores y líderes comunitarios de todo el mundo.
¿Cómo la apertura puede acelerar y fortalecer las luchas contra los complejos desafíos de nuestro tiempo? Esta es la pregunta clave detrás de conversaciones como la que puedes leer a continuación.
*
La conversación de hoy es con Andrés Vázquez, desarrollador sénior de Open Knowledge Foundation, especialista en CKAN, el sistema de gestión de datos de código abierto más utilizado del mundo.
Vázquez es un defensor de la tecnología cívica y gubernamental, colaborador histórico de las comunidades de datos abiertos en español y miembro de Open Data Córdoba. En los últimos años, ha trabajado en la implementación de portales de datos abiertos a distintos niveles, desde gobiernos locales hasta instituciones multilaterales globales. Actualmente, reside en Mendiolaza, Argentina.
En esta entrevista, realizada en el contexto de la reactivación de la comunidad CKAN en una reunión en Bolonia (Italia), reflexiona sobre el presente y el futuro de CKAN, las comunidades de datos abiertos en español y las vías de innovación en materia de apertura de datos.
Esperamos que disfrutes de la lectura.
*
Lucas Pretti: CKAN es el estándar de la industria para los portales de datos abiertos. Lo comparo con WordPress. Se suele decir que alrededor del 40 % de los sitios web utilizan esa plataforma, mientras que se estima que entre el 50 % y el 70 % de los portales de datos abiertos de países y grandes organizaciones utilizan CKAN. ¿Está CKAN a la altura teniendo en cuenta los desafíos actuales?
Andrés Vázquez: Cualquier gobierno, organización o empresa que planea abrir datos abiertos se va a encontrar con CKAN. Así como cualquiera que quiera hacer una página web se cruza con WordPress y lo analiza como opción, lo mismo ocurre con CKAN en el campo de los datos abiertos.
Quien quiera hacerlo de manera seria muy posiblemente termine eligiéndolo, porque es software libre, porque existe un ecosistema de empresas que ofrecen servicios alrededor de CKAN y porque, a pesar de cierta complejidad técnica, es la herramienta más consolidada.
Hay cientos de portales en el mundo que lo utilizan. Existe una página que intenta dar seguimiento a todos ellos, aunque no hay un número oficial exacto. Pero podemos decir que hoy lo usan el gobierno de Estados Unidos, el gobierno de Argentina, el de mi provincia (Córdoba), entre muchos, muchos otros.
En ese sentido, sí: CKAN es al mundo de los datos abiertos lo que WordPress es a la web. Es una tecnología lista para usar, que permite abrir un portal de datos abiertos de manera bastante rápida.
Lucas Pretti: Háblame un poco más de los pros y contras de CKAN, pero pensando en el panorama actual. Mencionaste antes algunos aspectos técnicos; me interesa entender mejor qué ventajas y desventajas tiene hoy en día.
Andrés Vázquez: Te cuento desde mi experiencia. Me tocó conducir un proyecto de gobierno abierto en una ciudad muy importante de mi provincia y tuve que decidir si usar o no CKAN. Gracias a esa experiencia puedo señalar con claridad los pros y contras.
Entre los pros, lo primero es que se trata de software libre, con una comunidad activa detrás. No solo es libre, sino que está diseñado para ser extensible: permite aplicar personalizaciones y modificaciones en un entorno separado del núcleo, lo que da mucha flexibilidad. No es un software “enlatado” que tengas que usar tal cual, sino que ofrece muchísimas posibilidades de adaptación. Ese es, sin duda, el mayor punto a favor.
El segundo aspecto positivo es la comunidad: hay mucha gente trabajando con CKAN, lo que facilita encontrar proveedores y soporte.
En cuanto a los contras, diría que la comunidad trabaja principalmente en inglés. No hay tantas empresas que ofrezcan servicios en español, aunque desde Open Knowledge hemos impulsado proyectos en este idioma porque contamos con capacidad en inglés y en español. En portugués la situación es mejor, porque la comunidad de Brasil siempre fue de las más activas y sólidas en temas de datos abiertos. Pero en general, fuera del inglés, el ecosistema es un poco más débil.
Otro contra tiene que ver con la arquitectura de CKAN: requiere varios servicios internos diferentes, no es una aplicación sencilla que solo requiere una base de datos. Esto puede complicar las implementaciones. Nos hemos encontrado con gobiernos que quisieron usar CKAN y, al no lograrlo, terminaron optando por otras soluciones.
De todos modos, hay un esfuerzo dentro de la comunidad de CKAN por simplificar drásticamente el proceso de instalación, para que llegue a ser tan fácil como instalar WordPress. Hoy por hoy, todavía no es así, y esa es una debilidad.
Lucas Pretti: Quería entrar justamente en el tema del idioma. Tú eres un histórico contribuidor y participante del movimiento de datos abiertos, especialmente en el mundo hispanohablante. Mencionaste que la comunidad alrededor de CKAN podría desarrollarse más. Pero más allá de CKAN, ¿cómo ves hoy el estado de salud y la madurez de las comunidades de datos abiertos en español, no solo en América Latina, sino en general?
Andrés Vázquez: Buena pregunta. Yo empecé a participar en la comunidad de datos abiertos a mediados de la década pasada, en un momento en que había un boom muy fuerte. En Argentina se abrieron muchos portales de datos: de ciudades, de provincias, y si no me equivoco, el Estado nacional también comenzaba con iniciativas. Incluso diría que los datos abiertos se pusieron de moda: había una fuerte exigencia de transparencia.
Mi mirada siempre fue que los datos abiertos deben entenderse como parte de la infraestructura de una ciudad o un país, igual que un puente. Si existen datos abiertos de calidad, preferentemente en tiempo real, emprendedores, periodistas y universidades pueden generar muchísimo valor a partir de ellos. Por supuesto que hay un derecho ciudadano a que los datos estén abiertos, pero mi énfasis siempre estuvo en su valor como infraestructura.
Dentro de la comunidad había distintas posturas: algunos más centrados en la transparencia y la lucha contra la corrupción, con un discurso más combativo, y otros – como yo – más enfocados en el potencial de los datos como activos de desarrollo.
Con el tiempo, cuando “todos” tuvieron un portal de datos porque era una moda, vino una especie de desilusión: la promesa de que todos los datos iban a estar abiertos no se cumplió. La moda pasó y el impulso inicial se desinfló.
Hoy, diría que estamos en un estado más tranquilo. Los gobiernos siguen abriendo datos, pero ya no hay una demanda social fuerte para consumirlos ni para exigir más transparencia. Justo hace poco alguien me escribió para contarme que los datos abiertos que impulsamos en la ciudad donde trabajé no se habían actualizado en los últimos años. Eso me dio cierta tristeza, porque refleja lo que pasó: hubo un boom, luego una caída, y ahora necesitamos reactivar esas comunidades y encontrarles un nuevo sentido.
Lucas Pretti: Ahora estás entrando en el mundo de la formación con tu academia. Eso me lleva a pensar en las nuevas generaciones: jóvenes que empiezan a acercarse a este campo. ¿Existe una generación que llega con interés en los datos abiertos, que les da importancia y los entiende? ¿O no tanto? Me refiero a estudiantes de computación, sociología, políticas públicas, entre otros. ¿Qué panorama ves y qué te preocupa en este escenario?
Andrés Vázquez: Como dices, estoy comenzando un emprendimiento personal vinculado a la enseñanza de programación, y allí quiero incorporar el uso de datos abiertos para despertar vocaciones de ciudadanía activa: que los estudiantes miren los datos, los analicen y saquen conclusiones.
No estoy en contacto tan directo con jóvenes recién egresados en computación, así que no quiero hablar en su nombre. Pero sí puedo contar que, cuando trabajé en el gobierno y en organizaciones locales, participé en muchísimos eventos y charlas con jóvenes.
Mi mensaje siempre fue el mismo: hay tecnologías que explotan y se ponen de moda – blockchain, Bitcoin, NFTs, ahora inteligencia artificial – y que captan toda la atención, pero muchas veces son distracciones. Lo importante es prestar atención a lo que realmente tiene valor. Por eso, cada vez que hablo con jóvenes programadores, les digo que hagan cosas que tengan sentido para ellos.
Creo que los datos abiertos son una excelente excusa para un joven que quiera hacer algo con impacto real. Te doy un ejemplo: hace diez años analicé padrones electorales y encontré irregularidades, como domicilios con más votantes de los esperables. En ese momento nadie le prestó mucha atención, pero recientemente ese tema volvió a aparecer en la agenda de un municipio y generó alarma. Algunos vecinos se interesaron y vieron que la tecnología podía ayudar a resolverlo. Lo mismo ocurre con los presupuestos de gobierno o el seguimiento de gastos: son temas que despiertan la curiosidad y muestran que la tecnología puede estar conectada con la vida cotidiana y con el deseo de participar activamente en la sociedad.
Por eso, en el curso que voy a dictar, seguramente trabajaremos con datos abiertos como punto de partida para despertar esa curiosidad. Si a los estudiantes les interesa, tiene mucho más sentido hacer algo con los datos de su propia comunidad que con Bitcoin u otras modas pasajeras. Ahí hay un enorme potencial para motivar a las nuevas generaciones.
Lucas Pretti: Déjame desarrollar un punto que mencionaste como una de las debilidades de CKAN: su complejidad técnica y la dependencia de otros servicios. Sé que en Open Knowledge, junto con Patricio Del Boca, hay conversaciones sobre un “CKAN lite”, un “CKANito” en español. ¿En qué momento estamos? ¿Cuál es tu visión para lograr un CKAN más simple?
Andrés Vázquez: Sí. En el contexto de las conversaciones que estamos impulsando desde Open Knowledge, bajo la iniciativa The Tech We Want (“La tecnología que queremos”), buscamos muchas cosas, pero principalmente simplicidad.
Nuestro objetivo es que CKAN esté al alcance de la mano en una versión lo más simplificada posible, para que gobiernos, organizaciones o comunidades – aunque no hablen inglés – puedan desplegarlo rápidamente y empezar a subir datos.
Nos gustaría muchísimo que existiera la posibilidad de entregar una solución “llave en mano”: presionar un botón y tener lista una instancia de CKAN, con los pasos de configuración reducidos al mínimo y con los servicios internos ya resueltos. Eso sería un gran avance, porque reduciría la fricción técnica y también la fricción del idioma.
Lo vemos todo el tiempo: periodistas, académicos, investigadores tienen datos valiosos que circulan de manera dispersa y desordenada. Si existiera una herramienta fácil de usar para consolidar esa información, el impacto sería enorme. Un ejemplo reciente fue el portal de datos abiertos de la Universidad Nacional de Córdoba, en el que participé en los últimos meses. Muy pocas universidades publican datos, en parte porque no es fácil hacerlo. Este portal abrió la puerta a que los investigadores puedan comenzar a subir información, y sería ideal que más instituciones siguieran ese camino.
Desde Open Knowledge siempre empujamos para que estas cosas pasen. Y creo que, cuando tengamos la tecnología simplificada que queremos, veremos muchos más proyectos así. Hoy la complejidad técnica es una contra, pero estamos trabajando en resolverla, y no es un problema tan difícil. Una vez solucionado, estoy seguro de que abrirá la puerta a que muchas más comunidades se sumen.
Lucas Pretti: En una conversación interna reciente, quedé muy intrigado cuando hablaste de MCP (Model Context Protocol), porque para mí era un término completamente nuevo. Y un poco lo entendí como una forma de orientar las preguntas a la inteligencia artificial para que no solo devuelva respuestas plausibles, sino también información con sustancia y valor real, más allá de alucinaciones. ¿Podrías explicar un poco mejor qué es MCP y, además, comentar sobre otras barreras o posibilidades de innovación que ves en este campo?
Andrés Vázquez: Es una excelente pregunta. Yo trabajo directa o indirectamente con gobiernos desde hace mucho tiempo y algo que siempre noto es que, cuando una tecnología se pone de moda, los gobiernos quieren adoptarla enseguida. Y es muy difícil escapar de esa lógica.
Recuerdo una vez, en una reunión, llegué a la conclusión de que más del 90% de los problemas tecnológicos de esa ciudad se podían resolver con herramientas que ya existían desde hacía décadas. Lo que se puso de moda la semana pasada no necesariamente resuelve los problemas reales. Es decir, buena parte de la tecnología que tenemos desde hace 20 años cubre la mayoría de las necesidades de una ciudad, pero muchas veces no se aprovecha.
Esto no significa que las tecnologías nuevas no tengan valor. Por ejemplo, blockchain puede servir para certificar que un dato no fue modificado y que efectivamente fue publicado por un gobierno. Y en inteligencia artificial pasa algo similar: es una tecnología tan apabullante que parece ocupar todos los espacios. Pero todavía vemos implementaciones poco efectivas. Hoy, por ejemplo, me comuniqué con un bot de inteligencia artificial de mi banco público y no pudo entender lo que quería preguntarle. Ese banco está gastando dinero en una solución que no funciona bien.
Entonces, no se trata de rechazar la inteligencia artificial, sino de pensar con claridad en qué casos puede realmente aportar valor. En Open Knowledge, por ejemplo, exploramos cómo usarla de manera responsable. Personalmente, cuando la uso, no le creo de entrada a lo que me responde, salvo que pueda verificarlo en otro lugar. Ese es el gran problema: la IA no fue diseñada para decir la verdad, sino para producir respuestas que tengan sentido. Y eso puede ser peligroso.
A partir de ahí conectamos con la idea de que los datos son lo más cercano que tenemos a hechos verificables. Creemos que la inteligencia artificial, que es muy buena para conversar, puede potenciarse si se apoya en datos confiables. Y aquí entran los MCP.
Los MCP son como pequeñas aplicaciones que asisten a la inteligencia artificial. Funcionan como servidores que le indican: “Yo sé responder este tipo de preguntas”. Por ejemplo, pensemos en el caso de la Universidad de Córdoba. Cada tanto, en Argentina surgen discursos que culpan a los extranjeros de distintos problemas, incluso de ocupar “demasiados” lugares en la universidad pública. Seguramente mucha gente irá a preguntarle a una IA cuántos estudiantes extranjeros hay en la Universidad de Córdoba. Ahí es donde un MCP puede aportar valor: creamos una aplicación que conecta a la IA con la base de datos oficial y que, en lugar de inventar una respuesta, entregue el número exacto, con un enlace al dataset para confirmarlo.
A mí me encantaría que la IA funcionara así: que no solo diera un número, sino que además ofreciera el link al dataset, la explicación del experto responsable y la fuente original. Eso generaría mucha más confianza.
CKAN, al ser extensible, nos permite soñar con este tipo de aplicaciones. Podríamos imaginar que cuando alguien sube un dataset también define qué preguntas responde ese dataset y cómo deben formularse las consultas. De esa forma, la IA tendría acceso directo a información verificable y podría dar respuestas mucho más ricas y confiables.
Además, hay otros proyectos interesantes en marcha, como el uso de embeddings para relacionar automáticamente datasets que parecen no estar vinculados, identificando conceptos comunes entre ellos. Esto haría que la búsqueda dentro de CKAN fuera mucho más potente.
Lo importante es que CKAN, al ser software libre, ofrece la posibilidad de extenderse y adaptarse. Y eso es clave. No conozco otra tecnología de datos abiertos que tenga esta flexibilidad para que cualquier persona con conocimientos técnicos pueda ampliar sus capacidades y generar innovaciones como estas, que ya son totalmente realizables hoy.
Lucas Pretti: CKAN tiene ya 20 años. Era 2005 cuando fue creado desde Open Knowledge. Mientras tanto, la velocidad del cambio científico y tecnológico es mayor que nunca, y no va a detenerse. Sin embargo, como decías antes, muchas veces no hacen falta las soluciones más nuevas, sino que hay tecnologías de hace tiempo que siguen siendo muy útiles. Entonces, en ese contexto, ¿cómo mantener a CKAN tan relevante en la próxima década como hasta ahora?
Andrés Vázquez: Creo que hay varias respuestas posibles porque se trata de un tema con distintas dimensiones.
En primer lugar, CKAN se va a mantener relevante mientras exista una comunidad de usuarios con interés en los datos abiertos y en participar del debate público. Si hay universidades, periodistas, emprendedores tecnológicos, organizaciones de la sociedad civil que demanden datos, esa misma demanda mantendrá a CKAN vigente. Porque, en definitiva, cuando alguien piensa en abrir datos, CKAN aparece siempre como la primera opción.
Otro aspecto clave es el financiero. Hoy el proyecto funciona bajo un esquema en el que la Open Knowledge Foundation es la organización principal, y a su alrededor hay empresas asociadas que colaboran y participan. Pero la fundación por sí sola no cuenta con la financiación suficiente para sostener todo el proyecto. Las empresas ayudan, pero creo que asegurar una base económica estable y sostenible es fundamental para el futuro de CKAN.
De hecho, en 2023, CKAN fue nombrado como un bien público digital por la Digital Public Goods Alliance (DPGA), lo cual es un reconocimiento importante. Y, como decías, no es común que un software con más de 10 años siga siendo tan relevante. Me gusta pensar en esa metáfora que circula en internet de una gran infraestructura tecnológica que se sostiene sobre un pequeño componente casi invisible. CKAN es un poco ese componente dentro de la infraestructura global de datos abiertos: pequeño en comparación, pero esencial.
El desafío, entonces, es lograr que el proyecto sea autosustentable, que no dependa solo de que haya instancias de CKAN corriendo en distintos lugares, sino que exista una comunidad activa que atienda demandas, reciba propuestas de mejora, escuche críticas y mantenga vivo el desarrollo. Para seguir siendo relevante, necesitamos llegar a ese punto en los próximos años.
También creo que CKAN debe seguir conectándose con tecnologías nuevas. No necesariamente subirse a todas las modas, pero sí pensar seriamente cómo integrar de manera útil innovaciones como la inteligencia artificial, tal como hablábamos antes. Usarla de un modo que tenga sentido y que realmente sume. Eso también ayudará a que CKAN siga ocupando un lugar central en el ecosistema de los datos abiertos.
Lucas Pretti: Para terminar, me gustaría abordar el tema del gobierno abierto. Se acerca la fecha de la cumbre global de la Open Government Partnership (OGP), y por ello estuve estudiando cuestiones relacionadas en las últimas semanas y encontré una frase en un material de la Fundação Escola Nacional de Administração Pública (Enap) de Brasil que decía que la gente suele confundir gobierno abierto únicamente con transparencia.
Es decir, cuando alguien dice: “Mis datos son abiertos, ahí están, ya está, el gobierno es abierto”, en realidad no es así. Gobierno abierto no se trata solo de transparencia, sino también de participación social, de colaboración, de otros aspectos más amplios. Y creo que CKAN contribuye a esa mirada limitada, porque de algún modo ayuda a decir: “Tengo mi portal de datos, soy abierto”. Sí, pero en realidad no es suficiente. Creo que merece una reflexión más profunda.
Andrés Vázquez: Sí, totalmente. El concepto de gobierno abierto fue muy discutido hace unos diez años, cuando empezó a ponerse de moda, y hubo distintos enfoques intelectuales al respecto. En mis primeros trabajos yo adhería a una visión en la que el gobierno abierto incluía los datos abiertos, pero también la participación y la colaboración de la ciudadanía.
No alcanza con que un gobierno publique un portal de datos abiertos – aunque por supuesto es fundamental hacerlo. Los datos abiertos son una de las patas del gobierno abierto, pero para que un gobierno sea realmente abierto, los ciudadanos deben sentir que existen espacios donde pueden participar, opinar y ser escuchados. Eso no se resuelve solo con un portal; requiere otras acciones.
También está la dimensión de la colaboración, que yo entiendo como una instancia de participación más avanzada, donde actores relevantes de la comunidad tengan voz en las decisiones de gobierno. Pienso, por ejemplo, en universidades, sindicatos, colegios profesionales, entidades que conocen profundamente la realidad de una comunidad y que no necesariamente forman parte del gobierno. Tiene que haber espacios en los que esos actores puedan opinar.
CKAN ayuda mucho en una de las patas del gobierno abierto – los datos abiertos –, pero CKAN no es gobierno abierto. CKAN es una herramienta para datos abiertos, y se necesita mucho más de parte de los gobiernos para realmente poder llamarse abiertos.







