No components marked as affected
Write-up published
Resolved
O problema aconteceu no serviço de buscas.Tentamos recuperar o serviço mas estava levando mais tempo do que o esperado. Migramos para o serviço de busca reserva.Acertamos o sistema de busca principal e colocamos ele com uma infra-estrutura maior, voltamos a usar o serviço principal.A causa do problema parece ter sido o aumento de volume nos acessos na parte da manhã e a demora pra o serviço automatizado de aumento de infra-estrutura.Vamos deixar uma quantidade maior de servidores e estamos monitorando o serviço.Vamos implementar um novo sistema de log essa semana para melhorar a avaliação de incidentes como esse.
Resolved
This incident has been resolved.
Monitoring
Estamos rodando o ambiente com a capacidade aumentada e monitorando seu comportamento. As lojas encontram-se disponíveis.
Identified
As falhas retornaram, a equipe está tomando novas ações.
Monitoring
Estamos monitorando o novo ambiente de buscas. A substituição retornou as lojas a operação normal.O problema iniciou-se aproximadamente 10:15 e entre alguns períodos de variação retornou ao estado normal as 11:04.
Identified
A equipe identificou falhas nas máquinas do ambiente de buscas e fará a substituição deste. As lojas devem voltar ao ar normalmente em seguida.
Investigating
A plataforma da versão Smartcheckout encontra-se indisponível. A equipe já identificou a falha e está atuando no problema.