Este documento reúne informações referentes ao incidente do dia 11 de setembro de 2023.
Neste dia, houve lentidão e indisponibilidade em diversos recursos da plataforma, como a listagem de chats e o recebimento de mensagens.
A causa raiz do incidente estava na ausência de um serviço utilizado pela nossa infraestrutura de servidores. Ele sofreu uma instabilidade em seu repositório de distribuição que afetou diversos sistemas ao redor do mundo.
Os recursos da plataforma que apresentaram lentidão e indisponibilidade dependiam desse serviço para o seu correto funcionamento.
Começamos a receber relatos de lentidão em recursos como a listagem de chats durante a manhã do dia 11 de setembro de 2023.
Ao investigarmos o ocorrido, identificamos uma inconsistência na infraestrutura dos nossos servidores.
Não levou muito tempo para encontrarmos a causa raiz do incidente: um serviço utilizado pela nossa infraestrutura sofreu uma instabilidade em seu repositório de distribuição, afetando diversos sistemas ao redor do mundo. Os recursos da plataforma que apresentaram lentidão e indisponibilidade dependiam desse serviço para o seu correto funcionamento.
Devido ao impacto global, os desenvolvedores do serviço chegaram a emitir uma notificação pública do incidente.
Identificamos que o incidente impactou recursos como:
Aplicamos uma atualização em nossa infraestrutura para provisionar os ambientes usando uma solução alternativa que não dependesse do serviço em instabilidade.
Liberamos uma primeira versão estável às 12:15 do dia 11 de setembro de 2023, cerca de 3h após o início do incidente. Nesse mesmo dia, validamos com sucesso a correção, às 12:35.
Pedimos desculpas pelo transtorno que causamos a você e reiteramos que estamos trabalhando para melhorar cada vez mais a segurança e a estabilidade da nossa plataforma.