Data Engineer Pleno
Descrição da Vaga
**Sobre o Desafio** Sua missão será garantir a disponibilidade, qualidade e performance dos dados que alimentam a maior plataforma reputacional do mundo. Você será um pilar técnico na migração e evolução da nossa plataforma de dados, construindo pipelines escaláveis utilizando **PySpark no GKE (Kubernetes)** e assegurando que nossa **Arquitetura Medalhão** seja eficiente, confiável e pronta para suportar o crescimento do negócio. **Responsabilidades e Atribuições** * **Desenvolvimento de Pipelines:** Escrever código **PySpark** limpo e pronto para produção, garantindo que os fluxos de dados sejam estáveis, testáveis e de fácil manutenção. * **Arquitetura Medalhão:** Operar, manter e otimizar as camadas de dados (**Bronze, Silver e Gold**), garantindo a integridade desde a ingestão bruta até o consumo final no BigQuery. * **Modernização \& Cloud:** Atuar ativamente na migração de legados e na evolução da infraestrutura para soluções nativas em **Google Cloud (GCP)**. * **Orquestração:** Gerenciar e monitorar fluxos de trabalho no **Cloud Composer (Airflow)**, assegurando a pontualidade e a resiliência das cargas. * **Qualidade de Dados:** Implementar validações e práticas de governança para garantir que o dado entregue seja o "único ponto da verdade". * **Escalabilidade:** Trabalhar com workloads conteinerizados no **Kubernetes (GKE)**, focando em eficiência computacional e performance. **Requisitos** * **Domínio de Python \& PySpark:** Experiência no desenvolvimento de processos de ETL/ELT distribuídos e processamento de grandes volumes de dados. * **Ecossistema GCP:** Conhecimento prático em **BigQuery**, **Cloud Storage** e **Cloud Composer**. * **Containers \& Kubernetes:** Experiência prática com **Docker** e **GKE** para execução de jobs de dados. * **SQL Avançado:** Capacidade de realizar transformações complexas, análise de planos de execução e otimização de consultas. * **Modelagem de Dados:** Entendimento de conceitos de Data Lake e Data Warehouse. **Diferenciais** * Conhecimento em ferramentas de **Infrastructure as Code (Terraform)**. * Experiência com ferramentas de **Data Quality** (Great Expectations, Soda, etc.). * Familiaridade com práticas de CI/CD para engenharia de dados.
Vaga originalmente publicada em: indeed
Receba vagas como esta no seu email
Crie um alerta gratuito e seja o primeiro a saber de novas oportunidades
Alertas que entendem o que você quer
Não receba qualquer vaga. Receba apenas as que combinam exatamente com o que você busca.
Filtro:
Você recebe tudo isso:
Filtro:
Você recebe apenas:
Zero ruído. Só vagas relevantes para você.
Outros exemplos de filtros precisos:
Filtros Combinados
Combine linguagem + framework + nível + localização. Seja tão específico quanto quiser.
Email Diário
Receba um resumo diário apenas com vagas que passam nos seus filtros. Sem spam.
Kanban Visual
Organize suas candidaturas em um quadro Kanban. Acompanhe cada processo seletivo.
Planos simples, sem surpresas
Comece grátis e faça upgrade quando quiser
Premium
- Tudo do plano gratuito
- Vagas salvas ilimitadas
- Quadros Kanban ilimitados
- Alertas de vagas por email
- Suporte prioritário
Pronto para encontrar sua vaga ideal?
Junte-se a milhares de desenvolvedores que já usam o Job For Dev
Encontre as melhores oportunidades para desenvolvedores no Job For Dev