Engenheiro de observabilidade sênior

Netvagas
Sênior
Presencial
Publicado em 27 de novembro de 2025

Descrição da Vaga

Descrição: É muito importante que você tenha e/ou saiba: * Experiência sólida em monitoração de infraestrutura e aplicações críticas. * Domínio em Zabbix (configuração e administração), incluindo criação de templates, triggers, mapas e dashboards. * Atuação com Datadog em contextos de APM (monitoramento de aplicações, análise de desempenho, rastreamento de transações e identificação de gargalos). * Experiência com Elasticsearch e Kibana para sustentação, análise e gestão de logs. * Familiaridade com OpenTelemetry para coleta e instrumentação de métricas, logs e traces em arquiteturas distribuídas (ex.: microserviços e containers). * Capacidade de análise e correlação de eventos para identificação de incidentes, falhas e anomalias. * Vivência com scripts de automação (Bash, Python ou PowerShell) para customização de alertas e integrações. * Conhecimentos em ferramentas complementares de monitoração e observabilidade, como Grafana e Prometheus. * Experiência com ambientes em nuvem (AWS, Azure ou OCI) e monitoramento de recursos cloud\-native. Desejáveis: * Conhecimento em boas práticas ITIL (gestão de incidentes, problemas e mudanças). Os desafios da função são: * Monitorar continuamente ambientes de TI, garantindo a disponibilidade, performance e confiabilidade dos serviços. * Implementar, configurar e manter ferramentas de observabilidade, incluindo Datadog (APM), Elasticsearch/Kibana, Zabbix, Grafana e Prometheus. * Realizar instrumentação e coleta de métricas, logs e traces utilizando OpenTelemetry em ambientes distribuídos. * Construir, evoluir e otimizar dashboards e painéis de monitoramento personalizados para diferentes times e necessidades do negócio. * Definir e ajustar thresholds, alarmes e detecções de anomalias, assegurando alertas proativos e redução de incidentes. * Correlacionar eventos e analisar dados para identificar causas de incidentes, antecipar falhas e recomendar ações preventivas. * Atuar na sustentação e suporte das ferramentas de monitoração, garantindo o funcionamento contínuo e evolução da stack. * Colaborar com times de engenharia, infraestrutura e produto para apoiar análises, decisões técnicas e respostas a incidentes. * Propor, desenhar e implementar melhorias de eficiência operacional na plataforma de observabilidade, buscando evolução contínua. * Documentar processos, configurações e boas práticas relacionadas à observabilidade. 2511270202401889458

Vaga originalmente publicada em: indeed

💼 Encontre as melhores oportunidades para desenvolvedores no Job For Dev