Detrás de la red

La caída de Facebook, WhatsApp e Instagram

SHUTTERSTOCK
Tiempo de lectura: 4 min

Muchas veces cuando hablamos de caídas en los servicios tendemos a imaginar un montón de servidores echando humo, o apagados. En realidad, no se trata tanto de eso, como la cadena de cosas que permiten que Facebook, Instagram o WhatsApp tengan fallos en puntos, que, aunque los técnicos intentamos minimizar a base de seguridad, redundancia o escalabilidad, se producen.

Publicidad

Lo ocurrido hoy con Facebook y sus derivados es uno de ellos. Un fallo. ¿Pero dónde? Bueno, debido a que las empresas de  Zuckeberg no suelen ser muy transparentes hablemos de lo más probable. A riesgo de equivocarme, que pudiera ocurrir, esto es lo que puede haber pasado.

Una posible explicación de la caída de Facebook

Verán, el proceso que lleva desde que tecleamos una web, o hacemos presión en el icono de WhatsApp de nuestro móvil es siempre muy similar. Pensemos que las redes fueran ciudades. Usaré Madrid, Valladolid y Soria,  por ejemplo. Si quisiéramos enviar un paquete con destino Valladolid el camino más corto sería por la A6. Si quisiera enviarlo a Soria por la A2. Pero podría enviar el paquete a Valladolid, pasar por Soria y entregarlo allí. Sería un camino más largo, pero posible. 

Publicidad

[Cómo es la infraestructura de internet y quiénes son sus dueños]

Pues una de las cosas que se usa en la red es lo que llamamos protocolo BGP (Border Gateway Protocol). El BGP se encarga de guardar las direcciones de todas las redes, nuestras ciudades, y sus posibles caminos, calculando cuál es el más corto y eficiente para entregar nuestros paquetes. Esto se hace en lo que llamamos tablas. Estas tablas se actualizan si las direcciones cambian, o hay caminos nuevos posibles.

El problema es cuando estas tablas desaparecen, o contienen datos erróneos. En nuestro ejemplo, ante la caída de Facebook, si desaparecieran las señales de la A6, o la A2, o el mismo nombre de las ciudades, no sabrían dónde entregar los paquetes, ni que carreteras utilizar, ni nada. Un caos.

Pues bien, esto es lo que parece que ha ocurrido. Para llegar a Facebook o WhatsApp nuestras peticiones no saben donde ir, por donde circular, ni siquiera si existen. También existen esas tablas para circular internamente por las ciudades grandes, no solo entre ciudades.  De hecho, todo este galimatías de tablas existe tanto externas, entre ciudades, o internas, para el tráfico en la misma ciudad.

¿Y por qué ha ocurrido? Pues normalmente suele corresponder a actualizaciones de los equipos que manejan todo esto, con lo que la solución suele ser un roll back, en castellano: marcha atrás. El error humano también entra en todos estos procesos. Ya saben, en seguridad decimos que una cadena es tan segura como el más débil de sus eslabones, y este solemos ser nosotros. Entiendo que es lo que está haciendo internamente Facebook, colocando sus cosas, y luego se actualizarán y publicarán al resto de las redes para que todo vuelva a ser un mundo de colores digno de Disney.

Publicidad

Los DNS, Domain Name System, se encargan de traducir los nombres que usamos en las respectivas direcciones IP donde se encuentran. A las 22:06, cuando escribo esto, los DNS de Google o Cloudflare no saben cuáles son las de Facebook y demás. No quiere decirse que las ciudades hayan desaparecido. Simplemente no saben llegar a ellas. 

Eso explica el que los DNS no sepan dónde está Facebook, a que muchos operadores presenten como “en venta” o “disponible” el dominio www.facebook.com. Simplemente al no encontrar sus datos, o cómo llegar, esos sistemas lo ven vacío o disponible. Ya les digo que se ahorren la tentación de “comprarlo”.

¿Qué nos queda? Pues sentarnos a esperar a que esas tablas de direcciones se reconstruyan, vuelvan a colocar la señalización por las carreteras, y que por fin quien lo use pueda llegar a los servicios.

18 Comentarios

Ya no se pueden publicar comentarios en este artículo.

  • Faltan más cosas en la noticia por explicar.
    Las tablas BGP se tienen que reescribir a mano físicamente, los empleados no podían acceder a los edificios de Facebook porque se acceden con ID que está guardada en los servidores. Ya han comenzado a escribir las tablas y ya empieza a haber funcionamiento, pero para que esté todo correcto no será hasta las 2 am española.
    Esta empresa ha tardado menos de 12 horas en arreglar su desconexión a Internet, el SEPE semanas ¿por qué?

    • En castellano??
      Secuestro!!
      A saber la millonada que habrá tenido que pagar Facebook para recuperar el control de sus redes en tan solo unas horas.

    • Porque esta empresa ha diseñado su estructura de información y dispone de técnicos y dinero suficientes para recuperar la operatividad del sistema. Además, Facebook no tiene otro problema que "soportar" su cadena de anunciantes y pocos ke exigirán responsabilidades.
      Por contra el SEPE al igual que otros organismos públicos tiene externalizadas las funciones de mantenimiento, operación, supervisan y puesta al día de los diferentes módulos del sistema, amén de recursos de todo tipo (personales, técnicos y económicos) escasos lo que origina que los proveedores de la externalizacion no estén controlados como debieran.
      Lo anterior es una explicación en ningún caso una justificación de las situaciones del SEPE.

  • Ojala hubieran caido Zoom, meet, classroom y microsoft teams

  • Por un futuro de naturalidad y autenticidad;
    #DeleteFacebook

  • Estoy con Jaime, por un fallo en las rutas no sucedería este corte mundial tan grave, a caso pensais que no tienen rutas alternativas? Aquí lo más probable es que sus sistemas hayan sido atacados, lo hayan detectado y han decidido aislarlos hasta que encuentren el malware.

  • No es un fallo técnico, ha sido provocado a propósito por la misma compañía