Engenheiro de dados pl

Netvagas
Não especificado
Remoto 🌐
Publicado em 06 de novembro de 2025

Descrição da Vaga

Descrição: Requisitos essenciais: * Experiência relevante com Python e SQL. * Sólidos conhecimentos em serviços AWS, incluindo: * Amazon S3 para armazenamento de dados. * Amazon Athena para consultas serverless. * Experiência com Trino (anteriormente PrestoSQL) para queries distribuídas. * Domínio do Databricks e Delta Lake para processamento de dados. * Experiência com PySpark para processamento de dados em larga escala. * Conhecimento em modelagem de dados e data warehousing. * Experiência com particionamento e otimização de performance em data lakes. * Domínio de versionamento Git e metodologias ágeis usando Azure DevOps. * Experiência com formatos de dados modernos (Parquet, Delta, Iceberg). Diferenciais: * Certificações AWS (Data Analytics, Solutions Architect ou Data Engineer). * Experiência com Apache Airflow para orquestração. * Experiência com streaming de dados (Kinesis, Kafka). * Conhecimento em dbt (Data Build Tool) para transformações. * Experiência com Great Expectations para qualidade de dados. * Familiaridade com ferramentas de CDC (Change Data Capture). * Conhecimento em observabilidade e monitoramento (Elastic Search com Kibana). * Experiência com APIs RESTful. * Conhecimento em containerização (Docker, Kubernetes). * Experiência com Terraform ou CloudFormation para IaC. O que esperamos que você realize: * Projetar e construir pipelines de dados eficientes utilizando AWS Athena, PySpark e Databricks. * Implementar e gerenciar data lakes no Amazon S3 com estruturas otimizadas * Desenvolver queries e análises complexas com Amazon Athena, Trino e Databricks. * Implementar processos de ETL/ELT para integração de múltiplas fontes de dados. * Otimizar a performance de queries e o processamento de dados em larga escala. * Participar de code reviews e fornecer mentoria técnica à equipe. * Colaborar com stakeholders de negócios para traduzir requisitos em soluções técnicas. * Implementar rotinas de monitoramento e observabilidade dos pipelines de dados * Agendar a execução de rotinas de ETL usando Apache Airflow. 251106020227693213

Vaga originalmente publicada em: indeed

Receba vagas como esta no seu email

Crie um alerta gratuito e seja o primeiro a saber de novas oportunidades

Criar Alerta Gratuito

Alertas que entendem o que você quer

Não receba qualquer vaga. Receba apenas as que combinam exatamente com o que você busca.

Alerta genérico

Filtro:

Python

Você recebe tudo isso:

Vaga de Python + Django
Vaga de Python + Flask
Vaga de Python + ETL/Data
Vaga de Python + Machine Learning
...e muito ruído no seu email
Alerta inteligente

Filtro:

Python+FastAPI

Você recebe apenas:

Desenvolvedor Python + FastAPI
Backend Engineer (FastAPI)
API Developer - Python/FastAPI

Zero ruído. Só vagas relevantes para você.

Outros exemplos de filtros precisos:

JavaScript+React+Remoto
Java+Spring Boot+Sênior
Go+Kubernetes

Filtros Combinados

Combine linguagem + framework + nível + localização. Seja tão específico quanto quiser.

Email Diário

Receba um resumo diário apenas com vagas que passam nos seus filtros. Sem spam.

Kanban Visual

Organize suas candidaturas em um quadro Kanban. Acompanhe cada processo seletivo.

Planos simples, sem surpresas

Comece grátis e faça upgrade quando quiser

Gratuito

R$ 0para sempre
  • Busca de vagas ilimitada
  • Salvar até 10 vagas
  • 1 quadro Kanban
Criar Conta Grátis
Popular

Premium

R$ 9,90/mês
  • Tudo do plano gratuito
  • Vagas salvas ilimitadas
  • Quadros Kanban ilimitados
  • Alertas de vagas por email
  • Suporte prioritário
3 dias grátis, sem cartão

Pronto para encontrar sua vaga ideal?

Junte-se a milhares de desenvolvedores que já usam o Job For Dev

Encontre as melhores oportunidades para desenvolvedores no Job For Dev

Engenheiro de dados pl - Netvagas | Job For Dev