Cloudflare – Um incidente nos servidores da Cloudflare provocou instabilidade e deixou partes da internet inacessíveis na manhã desta terça-feira (18). Plataformas como X (antigo Twitter), ChatGPT, Canva e Discord registraram lentidão, falhas de carregamento e erros de conexão.
Este, no entanto, não foi o primeiro problema do ano a causar uma pane em escala global. No fim de outubro, uma interrupção na Amazon Web Services (AWS), braço de computação em nuvem da Amazon, também tirou do ar centenas de serviços ao redor do mundo.
LEIA: Polícia prende mais de 30 que fizeram curso online para desbloquear celulares roubados
Na ocasião, especialistas chamaram atenção para a dependência de poucos provedores e para o quanto isso torna os apagões mais prováveis. Raphael Farinazzo, COO da PM3 e referência em Produtos Digitais no Brasil, conversou com o Olhar Digital sobre os episódios, o funcionamento da Cloudflare e os aprendizados que ficam.
O que aconteceu com a Cloudflare?
Um erro técnico afetou a infraestrutura da Cloudflare e tirou serviços do ar na manhã desta terça-feira (18). A instabilidade começou por volta das 8h (horário de Brasília). Cerca de uma hora depois, o Downdetector – plataforma que monitora o funcionamento de aplicativos e sites – já reunia mais de 3.500 relatos de falhas.
Diversos serviços que utilizam a rede da empresa passaram a exibir mensagens de erro que impediam o acesso. Em sua página de status, a Cloudflare confirmou que enfrentava um problema generalizado, afetando múltiplos clientes, e que estava investigando a origem da falha.
Às 10h09, a companhia informou que havia identificado o erro e começado a aplicar uma correção. Quatro minutos depois, às 10h13, comunicou que implementou ajustes que permitiram a recuperação dos sistemas, reduzindo as taxas de erro aos níveis normais. A página seguiu sendo atualizada com detalhes sobre o processo de estabilização.
O que é a Cloudflare?
A Cloudflare é uma empresa norte-americana especializada em segurança digital e otimização de desempenho para sites e aplicativos.
Segundo Farinazzo, o serviço desempenha um papel duplo: protege plataformas contra ataques cibernéticos e acelera o carregamento das páginas. Ele define a companhia como “uma espécie de posto de controle, um intermediário entre o usuário e o site”. Ele explica:
“A empresa mantém, em vários servidores espalhados pelo mundo, elementos necessários para que um site ou aplicativo funcione, como imagens, arquivos de estilo (CSS) e outros componentes importantes para o carregamento. Quando o usuário acessa esse site ou app, a Cloudflare entrega esses elementos a partir do servidor mais próximo dele, o que torna tudo mais rápido. Alguns conteúdos que mudam muito rapidamente, como dados dinâmicos do próprio site, não são armazenados. Mesmo assim, esse tráfego continua passando pela proteção da Cloudflare, que impede ataques hackers e outros tipos de ameaça”.
O COO afirma que o sistema realmente aumenta o desempenho e a segurança. No entanto, justamente por atuar como intermediária, qualquer falha nos servidores da empresa derruba automaticamente todos os serviços que dependem dela, o que foi exatamente o que ocorreu.
Origem da falha é desconhecida
Em nota ao Olhar Digital, a Cloudflare relatou ter identificado um “pico de tráfego incomum” por volta das 8h20, o que causou erros em parte do fluxo que passava por sua sede na Califórnia (EUA).
A empresa disse ainda não saber o que desencadeou o aumento abrupto de tráfego, e que o foco inicial é restabelecer os sistemas afetados. Apenas depois disso a investigação da causa será aprofundada. Para Farinazzo, a falta de detalhes é deliberada – e positiva.
“Quando você revela detalhes técnicos demais, acaba expondo o funcionamento do seu serviço – e, no caso deles, isso significa expor justamente o que mantém os clientes protegidos. Quanto menos informações públicas sobre como o sistema opera e como poderia ser derrubado, mais seguro ele permanece. Então, essa falta de detalhes é uma medida de proteção.”
Ele reforça que, como a Cloudflare foi projetada para suportar grandes volumes de tráfego, o episódio indica uma sobrecarga atípica, cujo motivo provavelmente não será revelado.
Outros apagões
A interrupção da Cloudflare se soma a outros grandes episódios de instabilidade registrados nos últimos meses.
Em 20 de outubro, uma falha na Amazon Web Services afetou centenas de plataformas, incluindo Zoom, Canva, Duolingo, Signal e Slack. No Brasil, serviços como iFood, Mercado Livre e o Prime Video oscilaram. A instabilidade se estendeu por todo o dia. Dias depois, a AWS apontou um bug no DynamoDB, seu sistema de banco de dados, como a causa.
No ano passado, uma falha no software da CrowdStrike derrubou parte significativa da internet global. O problema travou computadores no mundo inteiro, impactou serviços essenciais como hospitais e levou ao cancelamento de voos. O prejuízo total foi estimado em US$ 5 bilhões;
Por que os apagões estão mais comuns?
Especialistas consultados pela CNN durante a queda da AWS alertaram que falhas desse tipo podem ocorrer por várias razões, mas reconhecem que a frequência tem aumentado de forma preocupante.
Arthur Igreja, especialista em Tecnologia e Inovação, destaca que assustam a recorrência, a intensidade e o impacto desses “apagões”.
Fabricio Pellizon, Cloud Architecture & Implementation Manager da Enginnering Brasil, aponta a dependência excessiva de poucos provedores como um fator crítico.
Segundo ele, cerca de 20% de todo o tráfego global passa pela Cloudflare, o que significa que um quinto da internet fica vulnerável caso a empresa tenha um problema.
“Esses eventos demonstram que nem mesmo os maiores players de cloud computing estão imunes a interrupções. Tais eventos expõem a vulnerabilidade dos negócios que concentram toda a sua operação em uma única plataforma”, diz.
Farinazzo complementa que episódios assim reforçam a importância de investimentos consistentes em planos de recuperação de desastres.
“O aprendizado é que o plano de recuperação de desastres precisa ser cada vez melhor. Tem uma coisa difícil para quem trabalhar com tecnologia que é como a gente se antecipa para esses riscos do ponto de vista de custos”.
“A solução está na diversificação”, concorda Pellizon.
Prejuízos
Gustavo Torrente, head b2b da Alura + FIAP Para Empresas, explica que o impacto econômico varia conforme o tipo de serviço afetado.
Comparando os apagões, ele lembra que a queda da AWS tende a ser mais grave por envolver um serviço essencial – o servidor. Quando ele para, tudo para junto. Já a Cloudflare funciona como intermediária: a operação do cliente continua, mas o serviço deixa de ser entregue.
Apesar de a recuperação da Cloudflare ser mais simples, o dano financeiro depende diretamente do tempo fora do ar. “Quanto mais tempo fora do ar, maior o prejuízo. Vai depender de cada modelo de negócio: quando um banco fica indisponível por cinco minutos, tem um prejuízo muito maior do que um e-commerce.”
(Com informações de Olhar Digital)
(Foto: Reprodução/Freepik/opolja)