A casi un año del nacimiento de la edición de Gaia-X en España, seis grupos de trabajo constituidos por empresas e instituciones de distintos sectores intentan establecer casos de uso de los datos en nuestro país. Este año se acaban de reunir los grupos de trabajo de Salud, Movilidad e Industria para preparar lo que el de Turismo logró presentar el año pasado en FITUR 22: una radiografía de los posibles usos de espacios de datos en sus sectores.
La inteligencia artificial que nos fascina se construye con enormes registros de datos. Pero los datos solos no sirven para mucho: necesitamos compartirlos, analizarlos y sobre todo regulaciones y estándares que pongan de acuerdo a ciudadanos y empresas para impulsar esos desarrollos sin dejar de proteger los derechos de todos. En el cómo hacerlo hay varios retos a los que se enfrentan empresas, administraciones, desarrolladores de tecnología y ciudadanos. Y es ahí a donde apunta Gaia-X.
Hay muchos que ya tenían esto claro desde hace tiempo. Entre ellos están los médicos de un hospital público referente internacionalmente en trasplantes, como el Clínic de Barcelona, que colidera junto con Ametic el grupo de trabajo de Sanidad dentro de Gaia-X España. Además de utilizar los propios datos del paciente para tratarle, “nosotros nos dedicamos a hacer modelos predictivos de cómo van a ir los trasplantes, cómo podemos optimizarlos y claro, eso es un uso secundario de estos datos”, explica Ignacio Revuelta, doctor en Nefrología de la unidad de trasplantes del hospital.
“Son métodos para que si hay por ejemplo un nuevo COVID, todo fuera mejor, y no ir a salto de mata, como fue. Ese es uno de los objetivos, por eso los centros tecnológicos están metidos en Gaia-X, para poder aplicar inteligencia artificial, y nosotros estamos tan interesados en esa visión como en el uso primario de los datos”, dice este médico preguntado por los motivos que tienen para participar en Gaia-X España.
Los grupos de trabajo, como en el que está el Hospital Clinic, son los primeros pasos en España de esa ambición europea con nombre de película de ciencia ficción que es Gaia-X.
Gaia-X y su arquitectura
Con ese nombre, que también es el de la diosa griega de la Tierra, se bautizó en 2019 al gran proyecto europeo que trabaja en el desarrollo de una federación de infraestructuras de datos y proveedores de servicios que garantice la soberanía digital europea.
La llegada de la normativa de protección de datos ha dado lugar a un gran debate sobre la soberanía, porque millones de personas, empresas e instituciones alojan sus datos masivamente en servidores de gigantes tecnológicas localizadas fuera de Europa. Según Gartner ya en 2018, Amazon, Google, o Microsoft (hiperescaladores) controlaban el 70% del mercado.
Pero Gaia-X no es la “cloud europea” en el sentido de que compita contra esos servicios centralizados. No tendrá cables ni centros de datos sino más bien estándares y protocolos. Esta iniciativa del sector privado (con apoyo de los gobiernos) quiere crear una federación abierta de servicios de nube, que interoperen entre sí, que cumplan con los valores europeos de mercado, transparencia, portabilidad y soberanía digital y que permitan el aumento de la disponibilidad de los datos para la sociedad.
Con esto se refieren al impulso que quieren darle a la Economía del Dato, una economía basada en la explotación de los conjuntos de datos que existen en la sociedad.
Muchos de ellos ya están disponibles en el mercado de forma gratuita (como datos abiertos) o comercializados, pero si no se conocen o explotan, tienen un impacto limitado, o siguen sin estar accesibles. Por ejemplo, el 80 % de los datos y aplicaciones industriales de la UE todavía se ejecutan en servidores locales o en una nube privada, debido a la falta de plataformas tecnológicas completamente transparentes o interoperables.
Gaia-X no podría ser una entidad centralizada donde guardemos los datos de todos los europeos, sino que aspira a unificar a los diferentes proveedores nube (incluidos los estadounidenses) para desarrollar un nuevo sistema o paradigma en el que los usuarios pueden desacoplar sus aplicaciones de la infraestructura o plataforma, y hacerlo recobrando la soberanía digital europea.
Para que esto se produzca, hay muchos consensos que alinear y definir: leyes, aspectos tecnológicos, estándares, gobernanza, codificación, seguridad y privacidad, que deben estar establecidos e incorporados a los ámbitos de actuación de ciudadanos, empresas y gobierno. Gaia-X es una capa que intermediará entre la capa de datos (donde se produce la explotación de los datos de empresas, organizaciones y ciudadanos) y la capa de la infraestructura (servidores,redes, hiperescaladores).

Cómo funciona Gaia-X en España
Aunque Gaia-X surgió como una iniciativa privada en Alemania y Francia, el Parlamento Europeo lo adoptó rápidamente. En estos años el proyecto sufrió algunos retrasos, fue objeto de controversias y críticas por su enfoque demasiado burocrático, y también por el riesgo de la apropiación corporativa por parte de grandes empresas.
En España se constituyó como una asociación privada en marzo de 2022, aunque ha sido impulsada fuertemente por la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA) y más concretamente por la Oficina del Dato. Su director, Alberto Palomo, además es presidente del consejo gubernamental de Gaia-X España. Se eligió Talavera de la Reina como su sede entre 12 candidaturas.
Participan de ella 200 entidades, entre las que hay empresas, organismos de la administración pública, universidades y otras instituciones, como la Junta de Comunidades de Castilla-La Mancha, la Xunta de Galicia, IBM, Ametic, IndesIA, Telefónica, Amadeus, la Universidad Politécnica de Madrid, Cruz Roja, la Confederación Española de Organizaciones Empresariales (CEOE), Universidad de Zaragoza, la Asociación Española de Banca, Comisiones Obreras, Fundación ONCE, Cabildo de Gran Canaria, IAB Spain, Orange, Airbus, EIT Urban Mobility, y la Fundación General CSIC, entre otras.
Las entidades trabajan en Gaia-X en dos dimensiones, horizontalmente para definir tecnologías y estándares, y verticalmente a través de grupos de trabajo. Hay seis, liderados por entidades del sector: Turismo (AnySolution), Movilidad (Eit Urban Mobility), Industria 4.0 (IndesIA), Agro (CTIC), Salud (Ametic), y Tecnología (Tecnalia).
Algunas de las entidades, como el Hospital Clinic, vienen reuniéndose con otras desde antes de 2022 para establecer casos de uso de los espacios de datos que gestionan. “Nosotros hemos identificado que los próximos tres años vamos a necesitar más de 90.000 perfiles de datos de AI en España”, explica Nuria Ávalos, vicepresidenta de Gaia-X, y directora de IndesIA, y por eso desde el grupo de trabajo de Industria 4.0 están trabajando en las barreras que consideran que hay para adoptar esta tecnología.
Una de ellas es el desconocimiento de los empresarios de para qué sirve la explotación de los datos para IA en su negocio, y para vencer eso, buscan casos de uso. Ávalos dice que con su grupo de trabajo ya han recopilado “60-70 casos de uso realizados por estas empresas que son de verdad, no son un powerpoint”.
Espacios de datos, ontologías y gobernanza en Gaia-X
En Gaia-X España ya no hablan de data lakes (lagos de datos centralizados) sino de espacios de datos, que tienen otra arquitectura. Como explicaba Palomo en un reportaje de Newtral, pueden conectar distintas bases de datos, con diferentes permisos para los participantes, de forma descentralizada y compartiendo datos entre ellos. No hablamos necesariamente datos abiertos, sino repositorios conectados de datos interoperables entre empresas, organizaciones u otras entidades, que pueden tener acceso en determinado momento.
“No venimos a montar un data lake en Talavera de la Reina, venimos a articular ecosistemas de compartición de datos, y para esto tenéis que estar sentados aquí”, suele responder Palomo a las empresas que le preguntan por el hub nacional de Gaia X.

Los centros sanitarios, por ejemplo, tienen sus propios sistemas de informatización, pero luego hay que homogeneizar el lenguaje de los datos, consensuar una misma ontología para que esos datos sean intercambiables, es decir, interoperables entre los distintos centros o sistemas. A priori no es fácil. “Cada hospital tiene un acuerdo con diferentes empresas que proporcionan esa tecnología. Tú no puedes romper los acuerdos para hacer un proyecto”, dice Revuelta.
Además, en esa gobernanza de los datos actualmente hay dos modelos en liza. El modelo alemán dice que los datos son del ciudadano, y el modelo francés, que gestiona los datos a través de la empresa pública.
Un proyecto de ley de la Unión Europea propone que el nuevo espacio de datos sanitario a nivel europeo siga más el modelo francés, a través de una serie de agencias que controlarían el espacio de datos. La propuesta no está cerrada y España, que tendía al modelo de gobernanza por el ciudadano, por el momento no se ha posicionado. “Independientemente de un modelo u otro, al final diferentes instituciones tienen que compartir los datos y crear esos espacios”, señala Revuelta.
Tecnológicas como Accenture u Oracle ya piensan en un software de compartición, según Revuelta, que dice que mientras se ve qué tecnología se usará, “tenemos que ir trabajando en los retos a tratar, es donde estamos ahora”. Actualmente, en el grupo de Sanidad tienen identificados casos de uso concretos que se pueden activar, y hay unas 350 empresas registradas de España y Europa.
Un caso de uso: el viaje intermodal
Eccocar es una empresa que comenzó en 2015 alquilando vehículos entre particulares, como un carsharing, y ha ido adaptando su foco para centrarse en la digitalización del negocio del alquiler de coches. Proporcionan herramientas tecnológicas a empresas. El dato está en el centro de su negocio, ya que utilizan apps móviles con las que se pueden hacer reservas 100% digitales, desde la validación de la identidad del conductor hasta la firma del contrato y luego la posterior interacción con el vehículo. Son miembros de Gaia-X España y están viendo si colaborar con EONA X, un incipiente espacio de intercambio de datos de movilidad.
“Las empresas se están empezando a dar cuenta de que para mejorar su servicio no les llega únicamente con los datos que generan internamente, sino que necesitan complementarlo con datos de terceros”, dice Samuel Fraga, jefe de Datos de Eccocar. “El dato ya era importante antes, pero ahora se está transformando la idea de cómo se puede utilizar”.
Pone un ejemplo de caso de uso que más está sonando dentro de Gaia-X, el viaje intermodal. “Nosotros por ejemplo, podemos ser expertos en la industria del rent-a-car, y en la digitalización del proceso de alquiler, pero si tú quieres, por ejemplo hacer un viaje desde tu casa a la Torre Eiffel nosotros no podemos darte ese servicio. Pero a lo mejor sí puede aparecer un segundo agente que esté por encima de nosotros y utilice los datos por ejemplo de Iberia o de Air France y nuestros datos de alquiler de vehículo para decirte cómo ir de tu casa a la Torre Eiffel”. Ese tipo de intercambio de datos, que generan valor a través de la combinación de datos de diferentes empresas, es hacia donde se dirigen.
Los grupos de trabajo en Gaia-X España
En estas últimas semanas los grupos de trabajo de Salud, de Industria y de Movilidad han realizado varias reuniones de trabajo y convocatorias. No todos los grupos van a la misma velocidad. El de Turismo fue el que más se impulsó desde el principio, en parte porque tenían ya trabajo hecho, y por la importancia de esta industria en España, según el director de la Oficina del Dato. “Fue una apuesta, no se puede empezar con todos”, explica Revuelta.
Desde la Secretaría de Estado de Digitalización e Inteligencia Artificial consiguieron un millón de euros a través de financiación europea para el diseño de un espacio de datos interoperables de Turismo. Este grupo de trabajo presentó en 2022 una radiografía del sector en la que explican los casos de uso con datos abiertos y privados actuales, y se analiza la gobernanza de los datos específicamente en el ámbito turístico.
A pesar de la pandemia, el grupo de trabajo de Salud quedó por detrás. Siguen trabajando, como los otros grupos, aunque de momento no tienen financiación, ni pública ni privada. Otros países, como Alemania y Francia, sí han financiado a través del Estado nacional estos proyectos.
No hablamos necesariamente datos abiertos, sino de repositorios conectados de datos interoperables entre empresas, organizaciones u otras entidades
Aquí “se está valorando qué se va a hacer”, explica Revuelta. “Se prevé que haya cuotas de los socios, y fondos NextGen para esto, pero de momento no están activados”, dice refiriéndose al grupo de Salud. De todas maneras, no parece ser algo fundamental en esta etapa temprana. “La financiación es importantísima, pero si no hay nada detrás tampoco tiene mucho sentido, yo creo que tiene que llegar cuando haya una madurez en lo que hemos hecho. Así podremos hacer un buen uso de ella”, explica.
Joaquín Salvachúa, profesor de la Universidad Politécnica de Madrid y representante del grupo de Universidades y Organismos de Investigación en Gaia-X, explica que como “Gaia-X no va a ser ni un Amazon o un Google Cloud”, los profesores más adecuados para cada tema están trabajando en la parte de implementar tecnologías, protocolos y servicios. “Estamos haciendo un trabajo bastante técnico en todo ese tipo de implementaciones y lo que se llama los data connectors (conectores de datos), que son los que luego van a utilizarse para acceder a las bases de datos”.
Ahora mismo no existe una implementación de Gaia-X totalmente operativa, que funcione con todo lo que se ha especificado. “Es muy complicado técnicamente”, admite Revuelta. El objetivo de este año es conseguir que haya implementación de referencia y que en los distintos verticales empiecen ya a existir casos de uso. Para el diseño y la ejecución del software se utilizarán componentes de otros proyectos europeos, como Fiware, una plataforma impulsada por la Unión Europea, para el desarrollo y despliegue global de aplicaciones de código abierto.
Como todavía no existe una especificación completa, este tipo de tecnología tardará. “Se va avanzando, aunque se consiga algo, es muy ambicioso y tecnológicamente no están resueltos todavía todos los problemas, pero se conseguirá poco a poco. Este año probablemente no esté terminado”, dice Salvachúa.
Datos abiertos o datos interoperables
Ninguna de las personas dentro de Gaia-X España con las que hemos hablado mencionan como objetivo a los datos abiertos, más bien hablan de datos interoperables entre distintas entidades. Desde la Oficina del Dato, Palomo ha dicho a Newtral que no existe todavía un consenso sobre cómo hacer política de datos abiertos tan clara como para que se puedan aprovechar los fondos NextGen.
¿Tienen previsto publicar datos abiertos? “Eso ya se está haciendo”, dice Salvachúa desde las universidades. “Tenemos múltiples proyectos de conectores de datos abiertos. La mayor parte de las fuentes que conseguimos nosotros las estamos republicando en el portal europeo de datos abiertos”.
El profesor dice que el problema con los datos abiertos no está en el control, (“tú no tienes que garantizar ningún control sobre su uso, porque ya permiten su uso”), sino más bien que ciertas empresas no quieren ponerlos en abierto, porque pueden usarse para algo que no es lo que ellos inicialmente quieren.
“La gente tiene una resistencia que se va a intentar quitar precisamente dando una solución tecnológica que permita que los datos se usen solo para lo que su dueño lo permita… Con eso creemos que habrá más compartición de datos, pero sí, para ciertos casos de uso”, admite.
En las empresas no parecen estar orientados a abrir los datos de modo general para la sociedad, la prensa o la investigación. Preguntamos a varias si piensan abrir los datos o tienen alguna línea de trabajo en su grupo en Gaia-X en este sentido.
Ávalos, del grupo de Industria 4.0 dice que lo harán “en la medida en que identifiquemos un caso de uso en el que haya un modelo de negocio”, porque “a lo mejor no hace falta acceder a datos abiertos sino dar acceso a plataformas federadas para que los modelos corran en distintas plataformas sin tener que abrir tus datos”. Fraga, de Eccocar, dice que abrir datos fue algo que valoraron en su momento en su startup, pero a día de hoy no ven el potencial. Piensa que es posible que una vez que pasen por esta etapa de transición uno de los pasos siguientes pueda ser publicar datos abiertos, “siempre y cuando tenga sentido”.
Desde la universidad creen que una ventaja que tienen las universidades es que como proveedores de infraestructura pueden ser un punto neutro respecto a los intereses comerciales de las empresas. “Incluso podemos ofertar sitios para que se alojen de tal manera que no estén bajo el control de una determinada empresa”, dice Salvachúa. “Creemos que puede ser de gran relevancia para el futuro sobre todo de cara a investigadores, porque ahora mismo al conseguir un dataset (conjunto de datos) es muy importante el poderlo usar legalmente para todo tipo de investigaciones”.
Si alguien de la ciudadanía quiere usar datos interoperables, ¿tendrá que ser miembro activo de Gaia-X o estos espacios de datos van a estar al servicio de toda la sociedad? Salvachúa responde sin dudar que Gaia-X estará al servicio de todos.
Revuelta, del Clinic, coincide, aunque dice que no puede dar una respuesta exacta. “La intención es que cualquier persona pueda venir cumpliendo una serie de requisitos -que todavía no están definidos. La intención es que Gaia-X no sea un lobby. La Secretaría Estado no lo quiere, la Junta Directiva de la Asociación de momento no ha cambiado esa filosofía y no creo que lo haga, pero de momento la respuesta no la tengo. Si eso pasa, nosotros como miembros, nos iríamos de Gaia-X. Nosotros tenemos que velar, como empresa pública y como médicos de pacientes, que ese uso de los datos sea con unos fines que realmente aportan un retorno a la ciudadanía”, zanja.
- Alberto Palomo, Chief Data Officer de España
- Nuria Ávalos Villamor, VP de Gaia-X, directora de IndesIA, y directora Consorcios Digitales en Repsol
- Ignacio Revuelta, doctor en Nefrología, de la unidad de trasplante, Hospital Clinic Barcelona
- Joaquín Salvachúa, representante del grupo de Universidades y Organismos de Investigación en la Asamblea Constituyente de Gaia-X
- Samuel Fraga, responsable de datos en Eccocar
- Sitio web de Gaia-X España
- El Gobierno apoya el nacimiento de la Asociación de Gaia-X para que España lidere la economía del dato en Europa
- Press Release on Franco-German common work on a secure and trustworthy data infrastructure
- Ametic, Sesión de lanzamiento del espacio de datos de salud
- Gaia-X: Algo nunca visto hasta ahora
- Cinco Días, La estrategia tecnológica de la vieja Europa en la nueva normalidad
- Computerworld, Gaia-X: ¿fracasará la nube de datos europea?
- Euractiv, Gaia-X: A trojan horse for Big Tech in Europe
- Politico, Inside Gaia-X: How chaos and infighting are killing Europe’s grand cloud project