Post Mortem: Instabilidades dos últimos dias
Resolved

Nos últimos dias passamos por algumas instabilidades causadas por uma série de fatores e ambientes distintos dentro da nossa plataforma. Todas elas foram analisadas pelos seus times responsáveis e ações foram estudadas para evitar a recorrência dessas instabilidades.

A equipe do Dynamic Storage verificou uma fragilidade na sua API que permitia um elevado índice de erros dependendo do seu uso, o que comprometia o funcionamento do sistema. O uso inadequado foi identificado e alertado internamente e uma correção será lançada durante a semana para controlar essa situação.

A equipe do Checkout (Carrinho de compras) identificou também um comportamento inadequado em um dos componentes de cache da aplicação, e segundo nossas análises foi o causador da instabilidade apresentada hoje na plataforma. A equipe irá trabalhar para corrigir este componente em até duas semanas e como ação imediata aumentou a sensibilidade do monitoramento deste ambiente para evitar que o funcionamento seja novamente comprometido por este componente.

A equipe do nosso Repositório de Configurações identificou que foi a responsável pela demora na recuperação do sistema, o que agravou a instabilidade apresentada hoje, e redimensionou a sua infra-estrutura para evitar que este comportamento ocorra quando houver necessidade de recuperar o sistema.

Lamentamos os problemas causados e salientamos que todas as nossas equipes estarão sempre engajadas em oferecer a melhor solução e a ação mais rápida para continuar evoluindo e enfrentando os desafios que aparecerão.

Tue, Aug 18, 2015, 04:20 PM
8 years ago
Affected components

No components marked as affected

Updates

Resolved

Nos últimos dias passamos por algumas instabilidades causadas por uma série de fatores e ambientes distintos dentro da nossa plataforma. Todas elas foram analisadas pelos seus times responsáveis e ações foram estudadas para evitar a recorrência dessas instabilidades.

A equipe do Dynamic Storage verificou uma fragilidade na sua API que permitia um elevado índice de erros dependendo do seu uso, o que comprometia o funcionamento do sistema. O uso inadequado foi identificado e alertado internamente e uma correção será lançada durante a semana para controlar essa situação.

A equipe do Checkout (Carrinho de compras) identificou também um comportamento inadequado em um dos componentes de cache da aplicação, e segundo nossas análises foi o causador da instabilidade apresentada hoje na plataforma. A equipe irá trabalhar para corrigir este componente em até duas semanas e como ação imediata aumentou a sensibilidade do monitoramento deste ambiente para evitar que o funcionamento seja novamente comprometido por este componente.

A equipe do nosso Repositório de Configurações identificou que foi a responsável pela demora na recuperação do sistema, o que agravou a instabilidade apresentada hoje, e redimensionou a sua infra-estrutura para evitar que este comportamento ocorra quando houver necessidade de recuperar o sistema.

Lamentamos os problemas causados e salientamos que todas as nossas equipes estarão sempre engajadas em oferecer a melhor solução e a ação mais rápida para continuar evoluindo e enfrentando os desafios que aparecerão.

Tue, Aug 18, 2015, 04:20 PM