No sabemos si el monseñor Jeffrey Burrill era de los que aceptaba los términos y condiciones de las aplicaciones móviles sin leerlos previamente, o si tenía idea de los riesgos de la geolocalización. Lo que sabemos es que los datos que Burrill, el secretario general de la Conferencia Episcopal de Estados Unidos, dejaba recoger a una app en su móvil han acabado provocando su dimisión, tras conocerse que era homosexual. El prelado se encontraba desempeñando un papel destacado en la coordinación de la respuesta de la Iglesia Católica a los últimos escándalos de abusos sexuales.
El medio digital católico The Pillar obtuvo los datos de ubicación “comercialmente disponibles” a través de un vendedor, los analizó y comprobó que el alto funcionario católico había visitado bares homosexuales y residencias privadas mientras usaba Grindr, una app de contactos popular entre la comunidad gay.
No está muy claro cómo los editores de The Pillar obtuvieron los datos. El reportaje sólo dice que provinieron de un vendedor sin especificar cuál y que el medio luego contrató una “firma de consultoría de datos independiente” para autenticarlos.
Más allá del debate que esto ha provocado dentro de la comunidad religiosa, que reflexiona sobre las presiones eclesiales sobre la identidad sexual de sus miembros, y que cuestiona al medio por “espiar” a la vida privada de un obispo, el caso de Jeffrey Burrill demuestra que nuestros datos de geolocalización pueden revelar información muy específica, a pesar de que los datos recogidos por los teléfonos móviles están “anonimizados” en principio, a través de la sustitución de los nombres y teléfonos de los usuarios por un identificador numérico único.
Una huella digital
Con grandes cantidades de población con un dispositivo en el bolsillo conectado todo el tiempo surge la posibilidad de recolectar registros geográficos de los usuarios. Además de obtener un mapa, es posible que sean cruzados con otros metadatos que pueden dibujar una huella digital.
Los datos de localización son muy demandados porque permiten crear perfiles muy detallados de los usuarios, sus intereses, y de sus hábitos a una escala global
Publicidad
Así se pueden obtener informaciones como qué estaba haciendo una persona en su móvil cuando pasaba por determinado sitio; en qué edificio o urbanización permanece durante las 6-8 horas del día en que se supone que duerme al coincidir con la noche, y dónde pasa regularmente varias horas seguidas en el día, lo que probablemente pueda ser su trabajo.
Los riesgos de la geolocalización
Los datos de geolocalización son datos obtenidos del dispositivo inteligente de un usuario a través de aplicaciones móviles que acceden a sensores de posición como el GPS, o tomados por las compañías de telefonía a través de la asociación de nuestros móviles a las estaciones base o los puntos de acceso WiFi a los que nos conectamos. Estos datos indican la ubicación geográfica de ese dispositivo, y por tanto, del usuario. La granularidad de estos datos normalmente van desde la ciudad o el código postal hasta el nivel de calle y bloque, con unos 50 metros de precisión.
Narseo Vallina, investigador sobre seguridad en móviles en el International Computer Science Institute, explica que los datos de localización son muy demandados por un amplio espectro de industrias y organizaciones, por su utilidad y riqueza, y porque permiten crear perfiles muy detallados de los usuarios, sus intereses, y de sus hábitos a una escala global. “A través de ellos se puede inferir dónde vivimos, dónde trabajamos, nuestras relaciones personales, si conducimos por encima del límite de velocidad, si estuvimos en una manifestación, nuestro nivel socio-económico, si hacemos ejercicio regularmente o tenemos una vida sedentaria y nocturna, nuestra orientación sexual, nuestros hobbies, e incluso nuestra fe e ideología”, asegura.
Datos personales y datos sensibles
Con la explosión de los móviles, el aumento de la conectividad, y la facilidad de la recolección de datos de los usuarios, empresas y anunciantes encontraron un modelo de negocio que lograba financiar desarrollos y contenidos de la web abierta (que no gratuita), como hemos contado en Newtral.es, en un reportaje sobre las cookies de terceros.
Entre todos los tipos de datos que se recolectan, el de localización es considerado muy valioso, sobre todo cuando puede ser cruzado o agregado con otros. Se ha convertido en un recurso para poder inferir información de personas de manera legal usando datos anonimizados y sin tener que recolectarlos de primera mano.
La normativa europea de protección de datos no aplica para datos anonimizados que no puedan ser conectados con una persona. Pero si los datos de localización son procesados con otros relativos a un usuario, su dispositivo o su comportamiento, o son utilizados de manera en que se pueda distinguir a un individuo de otros, entonces se convierten en “datos personales” y caen dentro del alcance del Reglamento General de Protección de Datos (GDPR), incluso si otros identificadores tradicionales, tales como el nombre o la dirección no son conocidos.
Además de eso, si se dan ciertos contextos, como por ejemplo cuando revelan visitas a hospitales o centros religiosos o de culto, o manifestaciones políticas, los datos de localización se enlazan a una categoría especial de datos personales: los datos personales sensibles, que están sujetos a condiciones de tratamiento específicas.
Para qué sirven los datos de geolocalización
En 2020, un estudio de movilidad hecho con datos de GPS de 300.000 móviles españoles mostraba cómo se habían evaporado los peatones en zonas comerciales en pandemia. Detrás de él está Geoblink, una empresa enfocada en los datos de localización: enriquecen bases de datos, y entre otros servicios, venden su acceso a otras empresas. Se definen como una plataforma que ayuda a los comercios gestionar cualquier decisión que tenga que ver con la geolocalización.
Su director de operaciones, Rafa Pulido, dice que los datos de localización son cada vez más importantes dado el cambio de comportamiento del consumidor tras la pandemia. ¿Para qué sirven? “Para mil cosas”, dice y apunta a la utilidad de estos datos en el sector de las empresas de la ‘última milla’.
La last mile delivery se refiere a la logística urbana de empresas en lo relacionado con el reparto, como por ejemplo las ‘dark stores’ o tiendas oscuras, negocios que no cuentan con tiendas físicas abiertas al público sino sólo con espacios utilizados para operaciones administrativas. Los clientes realizan las compras vía online y reciben sus pedidos a través de un servicio de entrega a domicilio. Dentro de estas, y en el ámbito de la restauración, están las dark kitchens: locales donde desaparecen camareros, mesas y sillas para dar paso a una red de cocinas que únicamente elaboran comida para enviar a domicilio.
Pulido ve dos grandes tendencias. Dice que hay “mucho interés” por parte de las empresas por “entender qué está pasando dónde”, y por otro que está entrando “bastante inversión” en modelos de negocio en los que la localización es importante.
Cuando tus tuits revelan la casa de tu madre
La empresa Graphext, que se dedica a crear herramientas de análisis de datos, en 2016 tenía una demo para sus clientes de un estudio que había hecho con los datos públicos en Twitter de una lista de diputados y políticos españoles.
Si tienes activada la geolocalización en tus ajustes, todas las veces que publicas un tuit, el dato de dónde estás cuando envías un mensaje es público también. Con herramientas como la de Graphext se podía trazar un mapa que mostraba, por ejemplo, dónde habían estado los políticos al tuitear. Pero no sólo eso, sino que con ese análisis de datos se podía saber por ejemplo, que varios diputados volaban muy seguido a Suiza, y que algunos habían sido localizados en Panamá o en Gaza. Otra de las cosas que reveló el análisis fue la localización precisa de la vivienda de la madre de Pablo Iglesias. Twitter desactivó la localización exacta en 2019.
Panoramio, Foursquare y otras antiguas promesas
“Lo de la geolocalización suena superfascinante pero es una falsa promesa hasta ahora. Es algo que nunca llega, a lo que nunca se le ha podido sacar el jugo del todo”. Esto lo dice Eduardo Manchón, uno de los fundadores de Panoramio, empresa considerada caso de éxito por su uso pionero de datos de geolocalización aportados por los usuarios.
Cuando en 2005 Google decidió desbloquear la API de su servicio de mapas Google Maps, se empezaron a poder utilizar los mapas para incorporar contenido. A los primeros que se les ocurrió ponerle fotos fue a los fundadores de Panoramio, que construyeron la plataforma y la lanzaron en octubre de ese año.
Este sitio web, donde los usuarios particulares subían fotos georreferenciadas para ilustrar lugares del mundo, llegó a facturar 40.000 euros al mes en publicidad, y dos años después fue comprado por Google por entre 6 y 8 millones de dólares. Había llegado a tener casi 95 millones de fotos subidas por más de 4 millones de usuarios. Google finalmente lo cerró.
“Aún estamos esperando que alguien haga algo con datos de localización radicalmente diferente, más allá de análisis” – Eduardo Manchón
Manchón estuvo trabajando en Google tras la venta y cuenta que en esos años y hasta 2009-2010 era una época en que la localización prometía muchísimo. Una de las apps más exitosas a nivel mundial era Foursquare, que a través de los check-ins te hacía alcalde de un negocio, donde podías hasta obtener descuentos. El interés de los usuarios se perdió y Foursquare tuvo que pivotar su modelo para sobrevivir.
“Hoy aún estamos esperando que alguien haga algo con esa data realmente radicalmente diferente, más allá de análisis”, reflexiona Manchón, que recuerda una apuesta que hizo contra un ingeniero de Google hace 10 años. Manchón pensaba que llegaría una app donde el elemento de la geolocalización fuera central; el otro decía que la geolocalización era un complemento, un metadato, pero no realmente algo alrededor de lo que debería girar todo.
Las leyes de protección de datos no fueron realmente la causa de que no se haya avanzado más en este tipo de modelos para plataformas o negocios, según él. Simplemente la geolocalización no es un dato central, dice y pone un ejemplo de una app para conocer personas: “realmente la prioridad de que sean las personas que estén más cerca de ti no interesa, lo importante es que te guste su foto, o que te interesen sus gustos. Hay muchas otras variables más importantes”.
Otro ejemplo, con apps para buscar restaurantes: “quiero un restaurante cerca de mi, pero no quiero cualquiera, hoy quiero sushi y mañana quiero pizza. ¿Por qué no vas a caminar una o dos manzanas más por no ir a un sitio con más estrellas?”, explica. Quitando el caso de la analítica de datos, y algunos servicios muy concretos, como Wikiloc (una app para crear rutas GPS con el móvil), dice que la geolocalización es un dato complementario.
El valor de los datos cruzados y agregados
Wolfie Christl analizó cómo una patente que Facebook publicó en 2018 permite clasificar usuarios como clase trabajadora, clase media o clase alta a través de los siguientes datos: tiempo de uso de internet diario, velocidad de internet, distancia desde la vivienda al trabajo, datos de otros usuarios en la misma vivienda.
¿Cómo podía Facebook saber datos del tiempo de viaje desde casa al trabajo o la forma de transporte hasta la oficina? La respuesta estaba en los datos de localización que obtiene a través de sus apps móviles. ¿Cómo podía saber los tipos de electrodomésticos que un usuario tenía en su casa, o la cantidad de vehículos que tenía, el tamaño de la casa en metros cuadrados o incluso información sobre otros usuarios en la misma casa? Christl cree que podría haber sido a través de data brokers como Acxiom u Oracle.
Si el caso de Jeffrey Burrill hubiera ocurrido dentro de la UE, probablemente incumpliría varias normativas, empezando por el Reglamento General de Protección de Datos, que tiene muy en cuenta los riesgos de la geolocalización. Manchón observa que en este caso la localización a nivel de datos concretos eran parte de un trabajo especial que se hizo detrás del monseñor.
“En Estados Unidos casi todo se vende”, agrega y recuerda que en Mailtrack, la compañía de seguimiento de apertura de emails de la que es CEO en la actualidad, reciben de forma regular propuestas para comprarles los permisos de acceso a los buzones de correos. Estos datos están anonimizados, pero pueden revelar la identidad de las personas, como ha mostrado el caso del monseñor. “En la práctica es como si te dijera empieza por Ma-, termina por -ín, el apellido empieza por Go- y es periodista”, explica Manchón.
El dato de la localización es realmente valioso cuando va cruzado o agregado a otros, por la posibilidad de analítica y también porque permite obtener otros datos. Vallina dice que “en muchos casos, los datos de geolocalización se obtienen junto con otros datos personales como el email, el número de teléfono o incluso identificadores como el número de serie del dispositivo que permiten asociar esas trazas a un usuario de forma única. En muchos casos, estos datos son obtenidos de apps móviles directamente, y con el consentimiento del usuario, que no suele estar informado de los riesgos de la geolocalización, o a veces, no tiene opción. Todos estos datos se pueden agregar con otros más diversos como las cookies de navegación web o datos públicos como censos electorales para crear perfiles muy detallados de cientos de millones de usuarios a una escala global”.
La geolocalización como proxy
Geoblink trabaja con alrededor de 100-150 diferentes bases de datos por país, y tienen billones de datos de personas, de comportamiento, de movimientos, de accesos, de transacciones comerciales, con tarjetas de crédito, a nivel de todo el país. Utilizando esos puntos de información y aplicando sus modelos pueden generar estudios como el de la movilidad durante la pandemia, que es uno de los que más orgullosos están, según Pulido. “Somos capaces de ver para cualquier tramo de calle de los 50 metros, cualquier calle del país, cómo se está comportando: qué perfiles del tráfico peatonal están pasando por dónde, a qué hora del día, qué visitan, qué no visitan”.
Esta empresa ofrece perfilado de población y entre las fuentes de datos que usan están las bases de datos de compañías muy grandes (bancos, operadores de telefonía, por ejemplo Orange). “Siempre de forma anonimizada”, puntualiza Pulido.
¿Hay una diferencia entre el dato de localización y otros datos?, le pregunto. “Hay un tema con los datos localizados y es que te permite obtener insights [conocimiento] sin tener necesariamente que recolectar tú mismo los datos”. Sabe que se pueden comprar los datos, “pero muchas veces si quieres tener datos de calidad tienes que ser tú quien obtiene esos datos”. Con la RGPD y el tema de la privacidad en auge, “el acceso a los datos es cada vez más difícil y se tiene que hacer de forma responsable”. Entonces “el componente de localización es como un proxy [un intermediario] para entender cómo de relevante es ese dato para tu negocio”, explica Pulido, “porque los datos de localización te permiten inferir ciertos datos de manera legal y anonimizada”.
Las dos caras de la geolocalización
Es innegable que el acceso a cantidades masivas de datos en la actualidad ha supuesto una mayor cantidad de análisis que permiten tomar mejores decisiones y optimizar procesos en muchos ámbitos, como industria, educación, ciencia o entretenimiento. “Otra cosa es que se haga mal uso de los datos”, dice Manchón, y critica que generalmente se hable de la privacidad “en absolutos”. “Compartir los datos o poder analizarlos en agregado tiene un valor grandísimo que permite muchos avances tecnológicos, buenos para la sociedad”.
Vallina reconoce que “la revolución tecnológica y social que supuso la popularización de la telefonía móvil y los smartphones ha facilitado la creación de nuevas aplicaciones basadas en la geolocalización como mapas e incluso nuevos paradigmas de movilidad urbana. Sin embargo, también facilitó la creación de una industria basada en el procesado y empaquetado de nuestros datos personales para fines un tanto ‘oscuros’ y que son vendidos por empresas conocidas como data brokers”.
Fuentes
- Narseo Vallina, investigador sobre seguridad en móviles en el International Computer Science Institute y profesor de IMDEA Networks Institute
- Eduardo Manchón, fundador de Panoramio y Mailtrack
- Rafa Pulido, director de operaciones de Geoblink
- Victoriano Izquierdo, fundador y CEO de Graphext
- Pillar Investigates: USCCB gen sec Burrill resigns after sexual misconduct allegations
- ¿Qué datos personales se consideran sensibles, Comisión Europea
- De los bares a las gasolineras: así han desaparecido los españoles de las aceras, El País
- Corporate Surveillance in Everyday Life, Wolfie Christl, Cracked Labs