El protocolo BGP y por qué provocó que WhatsApp, Facebook e Instagram desaparecieran de internet durante horas!

Conectividad Economia

Ayer WhatsApp, Facebook e Instagram desaparecieron de internet. Estos servicios estuvieron caídos durante más de seis horas, pero finalmente todo volvió a la normalidad.

Esa enorme caída fue debida al llamado BGP o Border Gateway Protocol, uno de los sistemas que se utiliza en internet para llevar lo más rápido posible el tráfico a donde se necesita. ¿Cómo funciona el BGP y cómo es posible que la caída fuera tan grave? Es lo que explicamos a continuación.

Qué es y cómo funciona el BGP

Como indican en CloudFlare, este protocolo es un mecanismo para intercambiar información de enrutamiento entre los llamados sistemas autónomos (AS) en internet.

Marck Zuckerberg perdió suma millonaria con la caída de las redes sociales

En Wall Street, las acciones de Facebook llegaron a desplomarse hasta 6% y concluyeron un 4,9% abajo, a USD 326,23 y encabezaron las pérdidas de 2,1% en el promedio tecnológico Nasdaq. La fuerte tendencia bajista también golpeó a otros gigantes representativos del sector, como Apple (-2,5%), Microsoft (-2,1%), Twitter (-5,8%) y Alphabet (-2%).

Datos de acciones tecnológicas generalizadas en Wall Street

Internet es una red de redes, y hace uso de grandes routers que tienen a su vez enormes listas actualizadas de las posibles rutas que se pueden usar para llevar un paquete de datos desde el origen al destino.

Con BGP es posible que una red (como la de Facebook) avise a las demás redes de que está ahí, accesible, en internet. El problema es que Facebook ya no estaba avisando a las demás redes y a las operadoras de internet: es como si desapareciera de esas listas y de ese «mapa».

Cada una de esas redes individuales (como la de Facebook o la de Cloudflare) tiene el llamado ASN (Autonomous System Number), una red individual con una serie de normas internas y unificadas de enrutamiento de paquetes.

Cada sistema autónomo (AS) puede originar los llamados prefijos —que controlan un grupo de direcciones IP— y los prefijos de tránsito —que indican cómo alcanzar ciertos grupos específicos de IPs—. Los ASN van «anunciando» sus rutas prefijadas a través del BGP, y eso permite que otras redes sepan cómo comicarse con esa.

Facebook dejó de anunciar las rutas a los prefijos de sus servidores de nombres de dominio (DNS) a las 16:58 UTC. Ese hizo que aunque otras direcciones IP de Facebook estuvieran aún enrutadas, no pudieran ser accedidas: daba igual que esa parte estuviera activa, porque la caída de las DNS las hacía inaccesibles.

Frances Haugen, una experta en datos de 37 años, trabajó para empresas como Google y Pinterest y dijo que Facebook es “sustancialmente peor” de que lo que había visto antes todo eso en Facebook-Files.

Ese fallo provocó que los servicios que resuelven DNS fallaran. Estos servicios, como ya hemos explicado alguna vez, permiten que cuando escribamos por ejemplo «www.davichoops.com» en el navegador este sepa que las peticiones tienen que ir a la máquina con dirección IP 52.85.187.42.

Cuando Facebook dejó de anunciar el prefijo de enrutamiento o encaminamiento de sus DNS a través del BGP, los servicios de resolución de DNS no tuvieron forma de conectar a sus servidores de nombres: todos acabaron dando error, y eso causó más y más efectos colaterales.

Petici

Entre otras cosas, se incrementaron las peticiones a sitios como Twitter, Signal y otras plataformas de mensajería como Telegram, algo que también notaron en Cloudflare y con lo que de hecho hicieron una pequeña broma en Twitter diciendo «hola literalmente a todos» porque efectivamente muchísimos usuarios acudieron a Twitter en busca de respuestas. Incluso Facebook usó esta red para confirmar que tenían un problema técnico y estaban tratando de resolverlo.

Afortunadamente en Facebook lograron restablecer la situación a las 21:20 UTC: la actividad de su BGP volció a ser importante a eso de las 21:00 UTC según CloudFlare, y tuvo un pico a las 21:17 UTC.

Eso dejaba claro que en Facebook estaban volviendo a anunciar todos sus prefijos de enrutamiento, lo que permitió que aproximadamente a las 21:28 UTC el acceso normal a Facebook, WhatsApp e Instagram se restableciese.

Los ingenieros de Facebook también explicaban brevemente las causas del problema que les afectó. Lo hicieron en su blog Facebook Engineering.

«Cambios de configuración en los routers troncales que coordinan el tráfico de red entre nuestros centros de datos. Esa interrupción del tráfico de la red tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que provocó la paralización de nuestros servicios».

Por otra parte ……

Nick Clegg, vicepresidente de Facebook en materia política y asuntos mundiales, rechazó vehementemente que las plataformas de la empresa sean “tóxicas” para los adolescentes.

Clegg se pronunció días después de una tensa audiencia en el Congreso en la que los legisladores interrogaron a ejecutivos de Facebook sobre su impacto en la salud mental de los usuarios más jóvenes.

logo

¡No hacemos spam! Lee nuestra [link]política de privacidad[/link] para obtener más información.

Compartir

Deja una respuesta