Um Data Warehouse (DW) é um repositório central de dados integrados de uma ou mais fontes distintas. Ele armazena dados históricos e atuais em um único local, otimizado para consultas analíticas e geração de relatórios.
🎯 Características Principais
Orientado por Assunto: Organizado por temas de negócio (vendas, finanças, marketing)
Integrado: Dados de diferentes fontes são consolidados e padronizados
Não-volátil: Dados não são modificados, apenas inseridos e consultados
Variante no Tempo: Mantém histórico de dados para análises temporais
🔄 ETL - Extract, Transform, Load
Extract (Extrair): Coletar dados de sistemas transacionais (ERP, CRM, bancos de dados)
Transform (Transformar): Limpar, padronizar e converter dados para formato consistente
Load (Carregar): Inserir dados transformados no Data Warehouse
📈 Diferença: OLTP vs OLAP
Característica
OLTP (Transacional)
OLAP (Analítico)
Objetivo
Operações do dia a dia
Análise e decisões estratégicas
Tipo de Consulta
INSERT, UPDATE, DELETE
SELECT complexos
Volume de Dados
Dados atuais
Dados históricos massivos
Exemplo
Sistema de vendas em loja
Análise de vendas dos últimos 5 anos
🔷 Modelagem Dimensional
O que é?
A Modelagem Dimensional é uma técnica de design de banco de dados otimizada para consultas analíticas. Ela organiza os dados em Fatos e Dimensões.
Um Cubo OLAP (Online Analytical Processing) é uma estrutura multidimensional que permite análises rápidas de dados em diferentes perspectivas. Pense nele como um cubo de Rubik de dados!
📐 Dimensões do Cubo
Um cubo pode ter 3 ou mais dimensões. Cada dimensão representa uma perspectiva de análise: