Engenheiro(a) de ia & dados
Descrição da Vaga
Descrição: * IA Generativa: RAG, embeddings, structured output, tool usage/agents, prompt design, fine\-tuning (quando aplicável) e controle de custos/latência; * NLP/CV: OCR, detecção de objetos, classificação/extração; pipelines de pré\-processamento e avaliação; * ML Clássico/Deep: seleção de modelos, validação, métricas, explicabilidade básica; pipelines de treinamento/inferência; * Bases Vetoriais e busca semântica (ex.: Azure AI Search, Redis/FAISS/pgvector); * Microsoft Fabric: OneLake, Lakehouse, Data Warehouse, Pipelines (Data Factory), Dataflows Gen2, Notebooks (Spark/PySpark) e integração com Power BI (Direct Lake/Import/DirectQuery/Composite); * Camadas Bronze/Prata/Ouro, Delta/Parquet, particionamento, agendamento, orquestração e linhagem; * Proficiência em Python: Experiência sólida em programação, inclusive com bibliotecas científicas (NumPy, Pandas, Scikit\-learn, PyTorch, TensorFlow etc.); * SQL: construção e otimização de consultas avançadas; * Vector Base (Bases Vetoriais): armazenar embeddings e realizar busca semântica de alta performance; * Conectores (SQL Server, APIs/REST, arquivos, SFTP; desejável Firebird), cargas incrementais, CDC/Change Tracking, schema drift e reprocessamento idempotente; * Modelagem dimensional (Star/Snowflake), SCD 1/2 e boas práticas OLTP/OLAP; * DAX avançado, Incremental Refresh, Aggregations, RLS/OLS, semântica corporativa, governança de workspaces e Deployment Pipelines. * Data storytelling e padrões visuais corporativos; * Power Query (M), Power Pivot (DAX), Tabelas Dinâmicas, Modelo de Dados, XLOOKUP/XMATCH/LET/LAMBDA, validações e formatação condicional; * Versionamento (Git), CI/CD de dados e modelos (Fabric \+ Azure DevOps/GitHub), registro de modelos, feature store (quando houver); * Qualidade de dados (ex.: expectativas/regras de negócio), catálogo/linhagem e LGPD (PII, RLS/OLS), chaves/segredos (Key Vault). * Ter finalizado projetos ponto a ponto de dados \+ IA em produção, com participação na definição de escopo, arquitetura, custos e operação contínua; * Apresentação direta a áreas de negócio, com entregas sem supervisão constante e alto índice de confiabilidade; * Otimização de capacidade/custos no Fabric e de tokens/inferências em soluções de IA; * Diferencial experiência como desenvolvedor Backend. * Confiabilidade de pipelines (SLA/SLO), tempo de refresh e custo por atualização; * Acurácia/qualidade de dados (regras atendidas, taxa de incidentes) e performance de relatórios (Power BI) * Eficiência de IA (latência, custo por requisição, taxa de sucesso/extração, métricas de modelo); * Adoção pelo negócio (uso de dashboards/datasets, NPS interno) e redução de esforço manual. * Projetar/entregar soluções de IA Generativa \& Preditiva (RAG, embeddings, OCR, detecção de objetos, NLP), com MLOps/DataOps em produção; * Orquestrar pipelines ETL/ELT no Microsoft Fabric e disponibilizar dados confiáveis para Power BI e apps de IA. * Monitorar jobs/datasets/modelos (SLI/SLO/SLA), observabilidade e alertas; testes automatizados (SQL/DAX/transformações/validações); * Integrar e Deploy: Conectar pipelines de machine learning a sistemas de produção; * Otimizar Códigos: Habilidade para criar scripts eficientes, usando práticas de profiling e paralelização; 2512280202491769122
Vaga originalmente publicada em: indeed
💼 Encontre as melhores oportunidades para desenvolvedores no Job For Dev