Back to overview
Downtime

Instabilidade no Evolux Chat

May 31, 2026 at 1:34pm UTC
Affected services
Evolux Chat - API

Resolved
Jun 1, 2026 at 12:00pm UTC

Resumo da instabilidade no Evolux Chat (31/05/2026)
Na manhã de 31/05, parte do Evolux Chat ficou intermitentemente indisponível. Identificamos a causa, aplicamos a correção e o serviço voltou ao normal em poucos minutos. Nenhum dado foi perdido nem comprometido.

O que aconteceu
Parte das requisições passou a retornar erro em vez de carregar. Sintomas principais:
• Mensagens não apareciam em atendimentos abertos
• Atendimentos finalizados reapareciam como ativos
• Painel admin carregava sem configuração e sem métricas
• Atalho do Chat no Evolux Call exibia "Failed to contact the origin"

A página de acesso (estática) seguiu funcionando — o problema vinha das chamadas que dependem da camada de aplicação.

Impacto
• Duração: início da manhã até ~12h27 (horário de Brasília); ~11 min após identificarmos a causa
• Sem perda de dados: o problema era de entrega das requisições, não de gravação ou processamento

Causa raiz
A aplicação fica atrás de uma camada de entrega (CDN) que conecta aos servidores via conexões reutilizáveis. Uma das rotas internas ficou aderida a um servidor que não estava mais saudável: toda requisição que caía naquela rota recebia erro, enquanto as demais rotas seguiam respondendo — daí o padrão "às vezes funciona, às vezes não". O monitoramento padrão não capturou porque os servidores em si estavam sadios; a falha estava na rota entre a camada de entrega e a aplicação.

Como resolvemos
Alteramos a configuração da camada de entrega para forçar o restabelecimento das rotas internas com os servidores — equivalente a "religar" a conexão entre as camadas, sem reiniciar nem indisponibilizar nada. Os erros pararam logo em seguida e validamos o retorno ponta-a-ponta com clientes.

Linha do tempo (horário de Brasília)
• Início da manhã — a instabilidade começa silenciosamente
• 09h30 — atendimento sinaliza o time
• 09h30–10h34 — investigação: aplicação saudável, servidor sem incidente declarado, indícios apontam para algo entre a camada de entrega e a aplicação
• 10h34 — "sala de guerra" aberta para diagnóstico colaborativo
• 12h16 — correção aplicada
• 12h27 — equipe confirma resolução
• 12h53 — validação ponta-a-ponta com clientes concluída

O que vamos fazer para evitar que se repita
• Alerta proativo sobre erros da camada de entrega antes de chegarem ao cliente
• Fail-over automático entre rotas alternativas, sem intervenção humana
• Documentação do procedimento de mitigação para execução rápida por quem estiver de plantão
• Investigação técnica complementar com o provedor sobre o estado degradado do servidor

O que isso significa para você, cliente
• Evolux Chat normalizado desde 31/05 12h27
• Nenhum dado seu foi perdido ou alterado
• Correção estável e seguimos monitorando
• Melhorias acima em implantação para detecção e contorno automáticos

Ficamos à disposição.

Updated
May 31, 2026 at 3:15pm UTC

Identificamos a causa da instabilidade na infraestrutura e a equipe aplicou a correção. A plataforma já está operando normalmente e seguimos monitorando o ambiente para garantir a estabilidade. Agradecemos a compreensão durante o período de intermitência.

Created
May 31, 2026 at 1:34pm UTC

Estamos enfrentando um problema de infraestrutura que está gerando intermitência no uso da plataforma. Nossa equipe já está atuando para solucionar a degradação do sistema o mais rápido possível e restabelecer a operação normal. Agradecemos a compreensão.