🎯 Data Warehouse & Cubos OLAP

Aprenda de forma interativa e divertida!

📊 O que é Data Warehouse?

Definição

Um Data Warehouse (DW) é um repositório central de dados integrados de uma ou mais fontes distintas. Ele armazena dados históricos e atuais em um único local, otimizado para consultas analíticas e geração de relatórios.

🎯 Características Principais

🔄 ETL - Extract, Transform, Load

Extract (Extrair): Coletar dados de sistemas transacionais (ERP, CRM, bancos de dados)

Transform (Transformar): Limpar, padronizar e converter dados para formato consistente

Load (Carregar): Inserir dados transformados no Data Warehouse

📈 Diferença: OLTP vs OLAP

Característica OLTP (Transacional) OLAP (Analítico)
Objetivo Operações do dia a dia Análise e decisões estratégicas
Tipo de Consulta INSERT, UPDATE, DELETE SELECT complexos
Volume de Dados Dados atuais Dados históricos massivos
Exemplo Sistema de vendas em loja Análise de vendas dos últimos 5 anos

🔷 Modelagem Dimensional

O que é?

A Modelagem Dimensional é uma técnica de design de banco de dados otimizada para consultas analíticas. Ela organiza os dados em Fatos e Dimensões.

📊 Componentes Principais

Tabela FATO

Fato_Vendas
- id_produto (FK)
- id_cliente (FK)
- id_tempo (FK)
- id_loja (FK)
- quantidade_vendida
- valor_venda
- custo
- lucro

Tabelas DIMENSÃO

Dim_Produto
- id_produto (PK)
- nome
- categoria
- marca
- fornecedor
Dim_Cliente
- id_cliente (PK)
- nome
- cidade
- estado
- segmento
Dim_Tempo
- id_tempo (PK)
- data
- dia_semana
- mês
- trimestre
- ano
Dim_Loja
- id_loja (PK)
- nome_loja
- cidade
- região
- tipo

⭐ Esquema Estrela (Star Schema)

O Esquema Estrela é o modelo mais comum, onde uma tabela FATO central se conecta diretamente a várias tabelas DIMENSÃO, formando uma "estrela".

Vantagens:

  • Consultas simples e rápidas
  • Fácil compreensão
  • Melhor performance em queries

❄️ Esquema Floco de Neve (Snowflake Schema)

O Esquema Floco de Neve normaliza as dimensões, criando subdimensões conectadas hierarquicamente.

Exemplo: Dim_Produto → Dim_Categoria → Dim_Departamento

🧊 O que são Cubos OLAP?

Definição

Um Cubo OLAP (Online Analytical Processing) é uma estrutura multidimensional que permite análises rápidas de dados em diferentes perspectivas. Pense nele como um cubo de Rubik de dados!

📐 Dimensões do Cubo

Um cubo pode ter 3 ou mais dimensões. Cada dimensão representa uma perspectiva de análise:

🔍 Operações em Cubos

1. Slice (Fatiar): Seleciona uma única dimensão, criando um "slice" 2D

Exemplo: Vendas de 2024 em todas as cidades e produtos


2. Dice (Cortar em cubos): Seleciona múltiplas dimensões específicas

Exemplo: Vendas de Eletrônicos em SP durante Jan-Mar/2024


3. Drill-Down (Detalhar): Navega de dados agregados para mais detalhados

Exemplo: Vendas Anuais → Mensais → Diárias


4. Roll-Up (Agregar): Navega de dados detalhados para agregados

Exemplo: Vendas Diárias → Mensais → Anuais


5. Pivot (Rotacionar): Rotaciona o cubo para ver dados de outro ângulo

Exemplo: Trocar Produto por Tempo no eixo X

💡 Benefícios

🏪 Exemplo Prático: Rede de Supermercados

Cenário

Uma rede de supermercados com 50 lojas quer analisar suas vendas para tomar decisões estratégicas sobre estoque, marketing e expansão.

📋 Passo 1: Fontes de Dados (Sistemas OLTP)

  • Sistema de PDV: Registra cada venda realizada
  • Sistema de Estoque: Controla produtos e fornecedores
  • CRM: Dados de clientes e programa de fidelidade
  • Sistema de RH: Informações de funcionários

🔄 Passo 2: Processo ETL

Extract: Todas as noites, extrair vendas do dia de todas as lojas

Transform:

  • Padronizar nomes de produtos
  • Corrigir dados inconsistentes
  • Calcular métricas (lucro = venda - custo)
  • Criar chaves substitutas (IDs únicos)

Load: Carregar dados no Data Warehouse às 2h da manhã

🗄️ Passo 3: Modelo Dimensional - Star Schema

Fato_Vendas
Registros: 500 milhões (5 anos)

- quantidade: 2
- valor_unitario: R$ 5,50
- valor_total: R$ 11,00
- custo: R$ 7,00
- lucro: R$ 4,00

🧊 Passo 4: Criação do Cubo OLAP

Dimensões do Cubo:

  • Tempo: 2020 a 2024, meses, trimestres
  • Produto: 5.000 produtos em 15 categorias
  • Loja: 50 lojas em 5 regiões
  • Cliente: Segmentos (VIP, Regular, Novo)

Medidas: Valor Total, Quantidade, Lucro, Ticket Médio

📊 Passo 5: Análises Possíveis

Pergunta de Negócio Operação OLAP Resultado
Qual categoria vendeu mais em 2024? Slice + Roll-Up Bebidas: R$ 12M
Vendas de Natal por loja? Dice Loja SP Centro: R$ 850k
Tendência mensal de laticínios? Drill-Down + Pivot Crescimento de 15% no verão
Desempenho por região? Roll-Up Sudeste: 45% das vendas

💰 Passo 6: Valor Gerado

Decisões baseadas em dados:

  • Redução de 20% em produtos encalhados (identificação de sazonalidade)
  • Aumento de 15% em vendas com promoções direcionadas
  • Otimização de estoque economizando R$ 2M/ano
  • Identificação de lojas com baixo desempenho para treinamento

🎮 Jogo: Explore o Cubo de Vendas!

Missão: Navegue pelo cubo OLAP e encontre os insights corretos!

Pontos: 0 | Acertos: 0/5
TEMPO

📅 2020
📅 2021
📅 2022
📅 2023
📅 2024
CLIENTE

👑 VIP
👤 Regular
🆕 Novo
🌟 Fidelidade
PRODUTO

🥫 Alimentos
🧃 Bebidas
🧼 Limpeza
💊 Higiene
📱 Eletrônicos
MÉTRICAS

💰 Valor Total
📦 Quantidade
💵 Lucro
🎯 Ticket Médio
LOJA

🏢 Sudeste
🌴 Nordeste
🌾 Sul
🏔️ Centro-Oeste
🌲 Norte
OPERAÇÕES

✂️ Slice
🎲 Dice
🔽 Drill-Down
🔼 Roll-Up
🔄 Pivot

📋 Desafio Atual