Quando o digital falha, quem fica de pé?

08 de dezembro de 2025

por Redação The Shift

Quando o digital falha, quem fica de pé?

Na madrugada de 20 de outubro de 2025, uma falha de DNS na região US-East-1 da AWS paralisou partes do DynamoDB e de serviços dependentes, por horas, afetando milhões de usuários de serviços populares – Perplexity, Canva, Venmo, Roku, Lyft, Zoom, etc, além de sistemas da própria Amazon.

Não foi a primeira vez, e não será a última. Desde 2021, interrupções regionais tornaram-se eventos cíclicos na infraestrutura global: limitadas no tempo, mas amplas no impacto. Mesmo gigantes como AWS, Azure e Google Cloud compartilham vulnerabilidades estruturais.

Em julho, foi a vez da Microsoft: uma falha na região Leste dos EUA do Azure se espalhou e afetou organizações em cadeia. Pouco antes, uma série de interrupções na IBM Cloud deixou clientes questionando decisões de design – e uma terceira, mais curta, chegou a afetar 54 serviços.

A cada incidente, a reação se repete: manchetes alarmistas, indignação nas redes, promessas de redundância. Poucas horas depois, tudo volta ao normal – até a próxima queda. E seguimos tratando o problema como um episódio técnico, quando ele é, na verdade, organizacional.

Quando um componente comum degrada, milhares de empresas caem juntas. Isso não é um erro de design: é o preço da interdependência digital global. Durante anos, empresas confundiram “migração para a nuvem” com “terceirização do risco”. Mas resiliência não se compra em contrato – se projeta na arquitetura e se ensina na operação.

O colapso temporário da AWS, portanto, não é sobre a AWS. É sobre nós – e o quanto ainda projetamos sistemas (e organizações) como se o digital fosse eterno. Não é. Mas pode ser resiliente, se decidirmos tratar a continuidade como ativo estratégico, não como rodapé técnico.

Hoje, praticamente toda empresa é digital, mas poucas são resilientes. Esquecem que o digital é vulnerável por natureza – e que o verdadeiro diferencial competitivo não está em evitar falhas, mas em absorvê-las sem paralisar o negócio.
 

A vulnerabilidade inata do digital

A infraestrutura moderna é uma tapeçaria de interdependências: DNS, autenticação, mensageria, roteamento, energia – cada camada é um ponto potencial de falha. Mesmo provedores diferentes compartilham cabos, rotas e APIs. O resultado é um sistema global incrivelmente eficiente, porém sistemicamente frágil. Que o diga a ThousandEyes, uma empresa da Cisco, que monitora como os provedores estão lidando com quaisquer desafios de desempenho e fornece à Network World um resumo semanal dos eventos que impactam a prestação de serviços.

Essa fragilidade não é falha de engenharia. É característica do modelo de escala. Quanto maior a integração, maior o raio de explosão de qualquer erro. A ironia: o mesmo design que garante disponibilidade de 99,999% também garante que, quando falha, falha para todos ao mesmo tempo.

Estudos recentes mostram o custo real da ilusão de infalibilidade. Segundo a Forrester Consulting, 42% das empresas de e-commerce globais perdem mais de US$ 6 milhões/ano com interrupções da internet stack. A Oxford Economics estimou o prejuízo total das empresas do ranking Global 2000 em US$ 400 bilhões

anuais, devido a interrupções de sistemas digitais. Ainda assim, só 20% dos executivos se dizem preparados para responder a uma falha crítica.

O relatório “Annual Outage Analysis 2025”, do Uptime Institute, de maio deste ano, confirma que, mesmo com melhorias em design e equipamentos, a complexidade crescente das arquiteturas digitais cria novos riscos que precisam ser gerenciados ativamente.

Não é falta de tecnologia; é falta de prioridade executiva. Resiliência é tratada como rodapé técnico, quando deveria estar no balanço de risco corporativo.
 

Resiliência é governança, não infraestrutura

Projetar para o fracasso não é admitir derrota. É reconhecer a realidade física do digital. Arquitetura resiliente significa isolar dependências, planejar modos degradados e testar recuperação sob pressão. Mas nenhuma dessas práticas prospera sem patrocínio do topo.

Empresas que integram resiliência à governança – com comitês de continuidade, métricas de RTO/RPO e auditorias técnicas – recuperam-se até três vezes mais rápido após falhas graves, segundo benchmarks de mercado. Não por mágica tecnológica, mas por clareza de comando: sabem quem decide, quem comunica e o que sacrificar para manter o essencial.

Resiliência é o novo uptime. E, no fim, é isso que vai separar as empresas que tropeçam das que desmoronam.

Veja, no artigo completo da The Shift, o que isso significa para o seu negócio.

 


 

 

Conteúdo originalmente produzido e publicado por The Shift.
Reprodução autorizada exclusivamente para a Abranet. A reprodução por terceiros, parcial ou integral, não é permitida sem autorização.

leia

também