Engenheiro de observabilidade sênior
Descrição da Vaga
Descrição: É muito importante que você tenha e/ou saiba: * Experiência sólida em monitoração de infraestrutura e aplicações críticas. * Domínio em Zabbix (configuração e administração), incluindo criação de templates, triggers, mapas e dashboards. * Atuação com Datadog em contextos de APM (monitoramento de aplicações, análise de desempenho, rastreamento de transações e identificação de gargalos). * Experiência com Elasticsearch e Kibana para sustentação, análise e gestão de logs. * Familiaridade com OpenTelemetry para coleta e instrumentação de métricas, logs e traces em arquiteturas distribuídas (ex.: microserviços e containers). * Capacidade de análise e correlação de eventos para identificação de incidentes, falhas e anomalias. * Vivência com scripts de automação (Bash, Python ou PowerShell) para customização de alertas e integrações. * Conhecimentos em ferramentas complementares de monitoração e observabilidade, como Grafana e Prometheus. * Experiência com ambientes em nuvem (AWS, Azure ou OCI) e monitoramento de recursos cloud\-native. Desejáveis: * Conhecimento em boas práticas ITIL (gestão de incidentes, problemas e mudanças). Os desafios da função são: * Monitorar continuamente ambientes de TI, garantindo a disponibilidade, performance e confiabilidade dos serviços. * Implementar, configurar e manter ferramentas de observabilidade, incluindo Datadog (APM), Elasticsearch/Kibana, Zabbix, Grafana e Prometheus. * Realizar instrumentação e coleta de métricas, logs e traces utilizando OpenTelemetry em ambientes distribuídos. * Construir, evoluir e otimizar dashboards e painéis de monitoramento personalizados para diferentes times e necessidades do negócio. * Definir e ajustar thresholds, alarmes e detecções de anomalias, assegurando alertas proativos e redução de incidentes. * Correlacionar eventos e analisar dados para identificar causas de incidentes, antecipar falhas e recomendar ações preventivas. * Atuar na sustentação e suporte das ferramentas de monitoração, garantindo o funcionamento contínuo e evolução da stack. * Colaborar com times de engenharia, infraestrutura e produto para apoiar análises, decisões técnicas e respostas a incidentes. * Propor, desenhar e implementar melhorias de eficiência operacional na plataforma de observabilidade, buscando evolução contínua. * Documentar processos, configurações e boas práticas relacionadas à observabilidade. 2511270202401889458
Vaga originalmente publicada em: indeed
Receba vagas como esta no seu email
Crie um alerta gratuito e seja o primeiro a saber de novas oportunidades
Alertas que entendem o que você quer
Não receba qualquer vaga. Receba apenas as que combinam exatamente com o que você busca.
Filtro:
Você recebe tudo isso:
Filtro:
Você recebe apenas:
Zero ruído. Só vagas relevantes para você.
Outros exemplos de filtros precisos:
Filtros Combinados
Combine linguagem + framework + nível + localização. Seja tão específico quanto quiser.
Email Diário
Receba um resumo diário apenas com vagas que passam nos seus filtros. Sem spam.
Kanban Visual
Organize suas candidaturas em um quadro Kanban. Acompanhe cada processo seletivo.
Planos simples, sem surpresas
Comece grátis e faça upgrade quando quiser
Premium
- Tudo do plano gratuito
- Vagas salvas ilimitadas
- Quadros Kanban ilimitados
- Alertas de vagas por email
- Suporte prioritário
Pronto para encontrar sua vaga ideal?
Junte-se a milhares de desenvolvedores que já usam o Job For Dev
Encontre as melhores oportunidades para desenvolvedores no Job For Dev