Engenheiro de Dados

Sênior
Presencial
Publicado em 14 de janeiro de 2026

Descrição da Vaga

**?** **Vaga: Engenheiro(a) de Dados Sênior – IA / MLOps / Feature Engineering / RAG (AWS)** Estamos buscando um(a) Engenheiro(a) de Dados Sênior para atuar no core da nossa plataforma de Inteligência Artificial, sendo responsável por Data Lakes, Feature Engineering, pipelines de MLOps e construção de RAGs, viabilizando Machine Learning e IA Generativa em produção, em escala. Este papel é crítico para garantir que dados, features e contextos semânticos estejam prontos, governados e performáticos, sustentando modelos tradicionais de ML e LLMs. **?** **Missão do Papel** Projetar, construir e operar Data Lakes/Lakehouse, pipelines de dados e features, além de pipelines de RAG, em AWS, integrados a uma plataforma moderna de MLOps (Kubernetes, Kubeflow, MLflow). Atuar como espinha dorsal da IA em produção, com capacidade de colaborar em ML Engineering e IA Generativa quando necessário. **?** **O que você vai fazer** **?** **Data Lakes Lakehouse** * Projetar e manter Data Lakes/Lakehouse em AWS (S3\) * Definir organização por camadas (raw, curated, analytics, features) * Implementar versionamento, particionamento e historização de dados * Garantir dados prontos para Analytics, ML e IA Generativa **?** **Data Feature Engineering para IA** * Construir pipelines de dados batch e streaming * Desenvolver pipelines de feature engineering (offline e online) * Operar Feature Stores e garantir reutilização de features * Assegurar consistência entre treino e produção (training–serving skew) **?** **RAG – Retrieval\-Augmented Generation** * Construir pipelines de ingestão, chunking, enriquecimento e indexação de dados * Estruturar bases vetoriais para busca semântica * Integrar Data Lakes \+ Vector Databases \+ LLMs * Garantir atualização contínua, versionamento e governança do contexto * Suportar AI Agents e aplicações baseadas em RAG **?** **MLOps Plataforma** * Integrar dados e features com Kubeflow e MLflow * Apoiar pipelines de treinamento, deploy e inferência * Operar workloads de dados, ML e RAG em Kubernetes (EKS) * Garantir SLAs de dados para modelos e aplicações de IA **?** **Colaboração como ML Engineer** * Apoiar desenvolvimento e deploy de modelos quando necessário * Colaborar em validação, métricas e troubleshooting de modelos * Atuar como backup técnico em demandas críticas de IA **?** **Observabilidade, Qualidade e Governança** * Implementar data quality checks, monitoramento e alertas * Monitorar latência, falhas e impacto de dados/embeddings * Garantir lineage, metadata e documentação * Atuar junto à governança de dados e IA **?** **O que esperamos de você** **?** **Experiência** * 5\+ anos em Engenharia de Dados * Experiência prática com Data Lakes/Lakehouse * Vivência em pipelines de ML e IA Generativa em produção * Experiência em RAG, busca semântica ou sistemas baseados em embeddings * Forte atuação em AWS e Kubernetes * Capacidade de colaborar como ML Engineer quando necessário **?️** **Stack técnica (obrigatório)** **Cloud Dados** * **AWS:** S3, Glue, Athena, Redshift, IAM, CloudWatch * **Data Lake / Lakehouse** **Processamento Orquestração** * Apache Airflow (MWAA) * Spark / PySpark **MLOps IA** * Kubernetes (EKS) * Kubeflow MLflow * Feature Stores * Vector Databases (OpenSearch, FAISS, Pinecone ou similares) * AWS Bedrock (integração com LLMs) **Linguagens DevOps** * Python e SQL avançados * CI/CD e Infraestrutura como Código * Git **?** **Como medimos sucesso** * Data Lakes e pipelines entregues em produção * Pipelines de features reutilizáveis e versionadas * Pipelines de RAG em produção e atualizados * Latência de recuperação de contexto (RAG) * Incidentes de dados, features ou embeddings * % de modelos e agentes com dados governados * Eficiência de custos da plataforma de dados e IA * Processos e Modelos de Feature Enginnering e consequente melhoria de qualidade. * **Diferenciais** * Experiência com **AI Agents** * Observabilidade com **Prometheus, Grafana e AlertManager** * Governança de IA e dados sensíveis * Experiência em ambientes de alta escala e missão crítica

Vaga originalmente publicada em: indeed

Receba vagas como esta no seu email

Crie um alerta gratuito e seja o primeiro a saber de novas oportunidades

Criar Alerta Gratuito

Alertas que entendem o que você quer

Não receba qualquer vaga. Receba apenas as que combinam exatamente com o que você busca.

Alerta genérico

Filtro:

Python

Você recebe tudo isso:

Vaga de Python + Django
Vaga de Python + Flask
Vaga de Python + ETL/Data
Vaga de Python + Machine Learning
...e muito ruído no seu email
Alerta inteligente

Filtro:

Python+FastAPI

Você recebe apenas:

Desenvolvedor Python + FastAPI
Backend Engineer (FastAPI)
API Developer - Python/FastAPI

Zero ruído. Só vagas relevantes para você.

Outros exemplos de filtros precisos:

JavaScript+React+Remoto
Java+Spring Boot+Sênior
Go+Kubernetes

Filtros Combinados

Combine linguagem + framework + nível + localização. Seja tão específico quanto quiser.

Email Diário

Receba um resumo diário apenas com vagas que passam nos seus filtros. Sem spam.

Kanban Visual

Organize suas candidaturas em um quadro Kanban. Acompanhe cada processo seletivo.

Planos simples, sem surpresas

Comece grátis e faça upgrade quando quiser

Gratuito

R$ 0para sempre
  • Busca de vagas ilimitada
  • Salvar até 10 vagas
  • 1 quadro Kanban
Criar Conta Grátis
Popular

Premium

R$ 9,90/mês
  • Tudo do plano gratuito
  • Vagas salvas ilimitadas
  • Quadros Kanban ilimitados
  • Alertas de vagas por email
  • Suporte prioritário
3 dias grátis, sem cartão

Pronto para encontrar sua vaga ideal?

Junte-se a milhares de desenvolvedores que já usam o Job For Dev

Encontre as melhores oportunidades para desenvolvedores no Job For Dev