Site Reliability Engineer (SRE) - Especialista

MaisTODOS
Não especificado
Remoto 🌐
Publicado em 19 de março de 2026

Descrição da Vaga

**Principais responsabilidades/funções da vaga:** * Estratégia de Confiabilidade: Liderar técnicamente a governança global de SRE, definindo frameworks de SLIs/SLOs/SLAs que alinhem os objetivos de negócio à disponibilidade técnica em toda a organização. * Arquitetura de Entrega (GitOps): Desenvolver e evoluir a arquitetura de entrega contínua, utilizando ArgoCD e EKS, visando escalabilidade para múltiplos clusters e ambientes globais, garantindo conformidade e self\-healing. * Governança de Infraestrutura: Estabelecer padrões de arquitetura para IaC (Terraform), criando módulos reutilizáveis de alta abstração e gerindo a política de automação via Atlantis para garantir consistência entre todas as verticais. * Evolução da Observabilidade: Projetar a visão de longo prazo para observabilidade (Tracing, Logging, Metrics), integrando OpenTelemetry e Datadog para criar uma cultura de telemetria preditiva e redução drástica do MTTR (Mean Time To Recovery). * Segurança e Compliance Estratégico: Atuar como autoridade técnica em IAM e segurança de rede na AWS, desenhando modelos de Least Privilege automatizados e auditáveis para infraestrutura crítica. * Liderança em Incidentes e Cultura: Liderar a resposta a incidentes de escala sistêmica e institucionalizar a cultura de Post\-mortems blameless, garantindo que o aprendizado técnico se transforme em mudanças no roadmap de produto. * Evangelismo de Platform Engineering: Impulsionar a adoção de conceitos de Internal Developer Platform (IDP) para reduzir a carga cognitiva dos desenvolvedores e acelerar o time\-to\-market. **Competências Técnicas:** * Experiência sólida (8\+ anos): Trajetória comprovada em ambientes de alta escala, com histórico de decisões que impactaram múltiplos times ou a arquitetura core da empresa. * Visão Multicloud e AWS Especialista: Conhecimento profundo da AWS além do operacional, focando em otimização de custos (FinOps), performance de rede e arquiteturas resilientes em múltiplas zonas/regiões. * Engenharia de Kubernetes: Especialista em internals do EKS, segurança (Network Policies, OPA/Kyverno) e estratégias avançadas de escalonamento (Karpenter/KEDA). * Ecossistema GitOps Automação: Domínio arquitetural de ferramentas de orquestração (ArgoCD, Atlantis, GitHub Actions), desenhando fluxos que suportem centenas de deploys diários com segurança. * Desenvolvimento de Ferramental: Alta proficiência em Go ou Python para construir operadores de Kubernetes, CLIs customizadas e integrações de API que automatizam o ciclo de vida da infraestrutura. * Telemetria Avançada: Implementação de padrões de mercado como OpenTelemetry e gestão estratégica do stack de monitoramento para visibilidade full\-stack. * Observabilidade: Gestão de SLA, SLI e SLO's em soluçõs de mercado, principalmente Datadog. * Banco de Dados: Proficiência em identificação de gargalos em Clusters de Banco de Dados, como queries N\+1, falta de índices e problemas relacionados. ### **Regime de Contratação:** CLT ou PJ ### **Conhecimentos e Habilidades necessárias:** AWS, Engenharia de Kubernetes, Ecossistema GitOps \& Automação, Telemetria Avançada, Observabilidade, Banco de Dados ### **Benefícios:** Plano de saúde UNIMED, VR/VA no Cartão Caju, Wellhub \- Antigo Gympass, Refuturiza, MaisCare , Clube SESC, Bônus por metas anuais, Day\-off no mês do seu aniversário, Cartão de TODOS, Auxílio leite e fralda ### **Departamento:** Operacional

Vaga originalmente publicada em: indeed

Receba vagas como esta no seu email

Crie um alerta gratuito e seja o primeiro a saber de novas oportunidades

Criar Alerta Gratuito

Alertas que entendem o que você quer

Não receba qualquer vaga. Receba apenas as que combinam exatamente com o que você busca.

Alerta genérico

Filtro:

Python

Você recebe tudo isso:

Vaga de Python + Django
Vaga de Python + Flask
Vaga de Python + ETL/Data
Vaga de Python + Machine Learning
...e muito ruído no seu email
Alerta inteligente

Filtro:

Python+FastAPI

Você recebe apenas:

Desenvolvedor Python + FastAPI
Backend Engineer (FastAPI)
API Developer - Python/FastAPI

Zero ruído. Só vagas relevantes para você.

Outros exemplos de filtros precisos:

JavaScript+React+Remoto
Java+Spring Boot+Sênior
Go+Kubernetes

Filtros Combinados

Combine linguagem + framework + nível + localização. Seja tão específico quanto quiser.

Email Diário

Receba um resumo diário apenas com vagas que passam nos seus filtros. Sem spam.

Kanban Visual

Organize suas candidaturas em um quadro Kanban. Acompanhe cada processo seletivo.

Planos simples, sem surpresas

Comece grátis e faça upgrade quando quiser

Gratuito

R$ 0para sempre
  • Busca de vagas ilimitada
  • Salvar até 10 vagas
  • 1 quadro Kanban
Criar Conta Grátis
Popular

Premium

R$ 9,90/mês
  • Tudo do plano gratuito
  • Vagas salvas ilimitadas
  • Quadros Kanban ilimitados
  • Alertas de vagas por email
  • Suporte prioritário
3 dias grátis, sem cartão

Pronto para encontrar sua vaga ideal?

Junte-se a milhares de desenvolvedores que já usam o Job For Dev

Encontre as melhores oportunidades para desenvolvedores no Job For Dev

Site Reliability Engineer (SRE) - Especialista - MaisTODOS | Job For Dev