O desenvolvimento de atividades que possibilitem o efetivo assessoramento do processo decisório, sobretudo nos dias atuais, exige o uso de tecnologias modernas em proveito de políticas públicas de caráter estratégico. Nesta perspectiva, há a necessidade de manipulação, análise e tratamento de grandes volumes de dados, impondo a utilização de soluções modernas, capazes de viabilizar o tratamento de informações de maneira rápida, prática, interativa, de forma inteligente e dinâmica, utilizando diferentes formatos de dados disponibilizados por diversos sistemas de informação existentes na AGU, podemos organizar as atividades deste serviço da seguinte forma:
Atividades:
- Realizar extração e importação de dados internos;
- Realizar extração e importação de dados externos;
- Realizar análise descritiva;
- Higienizar e tratar os dados;
- Construir ou alterar modelo classificador, preditor ou desagrupamento;
- Interpretação e avaliação de modelo preditivo ou descritivo;
- Implantar modelo;
- Ágil de desenvolvimento de soluções de BI.
Requisitos:
- Estrutura de dados: Experiência no tratamento de dados estruturados, semi-estruturados e não estruturados;
- Estruturadas OLAP/OLTP: Conhecer a diferença entre OLAP e OLTP, formas de implementação de modelos OLAP utilizando-se de tecnologias abertas (Druid, Pinot, etc.) e proprietária da Microsoft (Vertipaq, MDX);
- ETL: Ferramentas ( NiFI, SSIS, Pentaho, Data Fabric) e MS Fabric;
- Python para ETL: Pandas, SparkDataFrame;
- Armazenamento Delta/Parquet: Formatos de armazenamento - csv, delta, parquet (características, particionamento, compactação, esquemas);
- SQL/NSQL: Storede Procedures, Conversões de Tipos, Particionamento, Funções de Janela, joins, updates, otimização de consultas, tabelas temporárias;
- Análise estatística: População e amostra, testes estatísticos (Alpha, Beta, P-Values, regressão, comparação, correlação), intervalo de confiança, padronização e normalização de dados;
- Análise estatística - Principais métricas: Média, mediana, moda, ponderações;
- Esquemas de DW: Modelo Estrela e Floco de neve - Vantagens e desvantagens de cada modelo. Melhores práticas para construção de tabelas de fato e dimensões. Criação de métricas otimizadas;
- Representações Gráficas: Proporções, Valores categóricos, Variáveis relacionadas, variáveis não relacionadas;
- PowerBI: DAX, boas práticas na criação de medidas, kpi e dashboards e modelos. Funcionalidades do Fabric: Workspaces, Pipelines, Lakehouses, Notebooks, Sparkjobs, modelos semânticos;
- PowerBI - Report Builder: Criação de relatórios paginados;
- Storytelling: Criação de roteiro para visualização de dados e construção de narrativa que transmita a informação.
Aplicar-se a Vaga