Por: Arshad Ali | Atualizado em: 2013-06-24 | Comentários (9) | Relacionados: > Análise de Desenvolvimento de Serviços
- Problema
- solução
- Enterprise Data Warehouse (EDW ou DW) Vs. Armazenamento de dados operacionais (ODS)
- Armazém de Dados Metodologias de Projeto
- Bill Inmon – Cima-para-baixo Armazém de Dados de Abordagem de Design
- Ralph Kimball-abordagem de design de Data Warehouse de baixo para cima
- Próximos Passos
- Sobre o autor
Problema
No meu último par de pontas, eu falei sobre a importância de uma solução de Business Intelligence, porque está se tornando prioridade forexecutives, o que um típico sistema de Business Intelligence arquitetura parece, etc. Nesta dica, vou falar em detalhesobre como um Data warehouse é diferente do armazenamento de dados operacional e as diferentes metodologias de design para um data warehouse.
solução
esta dica vai cobrir Data Warehouses (DW, às vezes também chamado de Enterprise Data Warehouse ou EDW), como difere do Operational Data Store (ODS) e diferentes metodologias de design de Data Warehouse.
Enterprise Data Warehouse (EDW ou DW) Vs. Armazenamento de dados operacionais (ODS)
o objetivo do Data Warehouse na arquitetura geral de Business Intelligence é integrar dados corporativos de diferentes fontes de dados heterogêneas, a fim de facilitar o relatório de análise histórica e de tendências. Ele atua como um repositório central e contém a “versão única da verdade” para a organização que foi cuidadosamente construída a partir de dados armazenados em diferentes bancos de dados operacionais internos e externos\sistemas. Para um melhor desempenho, a maioria dos dados no data warehouse será de forma não normalizada, que pode ser categorizada em esquemas de estrela ou floco de neve (mais sobre isso na próxima dica).
o objetivo do Operation Data Store (ODS) é integrar dados corporativos de diferentes fontes de dados heterogêneas, a fim de facilitar relatórios operacionais em tempo real ou quase em tempo real. Muitas vezes, os dados nos ODS estarão estruturados de forma semelhante aos sistemas de origem, embora durante a integração possam envolver a limpeza, a desduplicação de dados e possam aplicar regras de negócios para garantir a integridade dos dados. Um ODS destina-se principalmente a integrar dados com bastante frequência no nível granular mais baixo para relatórios operacionais em um cenário de integração de dados próximo ao tempo real. Normalmente, um ODS não será otimizado para análise histórica e de tendências em um enorme conjunto de dados.
vamos resumir as diferenças entre um ODS e DW:
- ODS é destinado operacional de relatórios e suporte atual ou perto de relatórios em tempo real os requisitos whereasa DW é destinado a histórica e a tendência de relatório de análise de um grande volume de dados
- ODS é direcionado para baixo granular consultas considerando que um DW é utilizado para consultas complexas contra a nível de resumo ou em dados agregados
- ODS fornece informações operacionais, decisões táticas sobre a atual ou perto de real-tempo de aquisição de dados whereasa DW fornece feedback para decisões estratégicas de liderança global de melhoria do sistema
- Em um ODS a frequência de carregamento de dados pode ser por hora ou diária, enquanto que em um DWthe frequência de cargas de dados pode ser diária, semanal, mensal ou trimestral
Armazém de Dados Metodologias de Projeto
Existem duas metodologias diferentes, normalmente seguido quando a concepção de um Armazém de Dados e solução baseado no requisitos de seu projeto, você pode escolher qual se encaixa melhor ao seu cenário específico. Essas metodologias são resultado de pesquisas de BillInmon e Ralph Kimball.
Bill Inmon – Cima-para-baixo Armazém de Dados de Abordagem de Design
Bill Inmon é por vezes referido como o “pai de armazenamento de dados”; sua metodologia de projeto é baseado ona abordagem top-down e define data warehouse nestes termos
- Assunto orientado – Os dados em um data warehouse é classificado com base na área e, portanto, é “orientada para o sujeito”.Integrado-os dados são integrados a partir de diferentes fontes de dados díspares e, portanto, convenções universais de nomenclatura, medições, classificações e assim por diante usadas no data warehouse. O data warehouse fornece uma visão consolidada dos dados da empresa e, portanto, é designado como uma solução integrada.
- não volátil-uma vez que os dados são integrados\carregados no data warehouse, eles só podem ser lidos. Os usuários não podem fazer alterações nos dados e issoA prática torna os dados não voláteis.
- variante de tempo-finalmente, os dados são armazenados por longos períodos de tempo quantificados em anos e têm uma data e hora e, portanto, são descritos como “variante de tempo”.
Bill Inmon viu a necessidade de integrar dados de diferentes sistemas OLTP em um repositório centralizado (calleda Data warehouse) com a chamada abordagem de cima para baixo. Bill Inmon prevê um data warehouse no centro da” Corporate Information Factory ” (CIF), que fornece uma estrutura lógica para fornecer inteligência de negócios (BI), análise de negócios e recursos de gerenciamento de negócios.
este design de cima para baixo fornece uma visão dimensional altamente consistente dos dados entre os data marts, pois todos os data marts são carregados do repositório centralizado (Data Warehouse).O design de cima para baixo também provou ser flexível para suportar mudanças de negócios à medida que looksat a organização como um todo, não em cada função ou processo de negócios de teorização. Gerar um novo dimensional data marts contra os dados armazenados Emo data warehouse é uma tarefa relativamente simples. Embora existam alguns desafios para a abordagem de cima para baixo, por exemplo, representa um projeto muito grande com um escopo muito amplo e, portanto, o custo inicial para a implementação de um data warehouse usando a metodologia de cima para baixo é significativo.Além disso, a duração do tempo desde o início do projeto até o ponto em que os usuários finais começam a experimentar os benefícios iniciais da solução pode ser substancial. Além disso, a metodologia de cima para baixo pode ser inflexível e não responder às mudanças nas necessidades de processos departamentais ou de negócios (uma preocupação com o ambiente de mudança dinâmica de hoje) durante a fase de implementação.
Ralph Kimball-abordagem de design de Data Warehouse de baixo para cima
Ralph Kimball é um autor renomado sobre o assunto de data warehousing. Sua metodologia de design é chamada modelagem dimensional OUA metodologia Kimball. Essa metodologia se concentra em uma abordagem de baixo para cima, enfatizando o valor do Data warehouse para os usuários o mais rápido possível. Em sua visão, um Data warehouse é a cópia dos dados transacionais especificamente estruturados para consulta analítica e relatórios, a fim de apoiar o sistema de apoio à decisão. De acordo com sua metodologia, data marts são primeirocriado para fornecer relatórios e capacidades analíticas para specificbusiness\processos funcionais e, posteriormente, esses Data marts podem eventualmente serunionados juntos para criar um data warehouse corporativo abrangente. A abordagem bottom-up concentra-se em cada processo de negócios em um ponto de timeso retorno sobre o investimento pode ser tão rápido quanto o primeiro Data mart é criado. Embora, se não for cuidadosamente planejado, você pode não ter a visão geral do Data warehouse corporativo, perdendo algumas dimensões ou criando dimensões redundantes, etc. quando você está muito focado em um processo de negócios individual.
a abordagem bottom-up de Ralph Kimball propõe criar uma matriz de negócios que deve conter todos os elementos comuns (que são usados por data marts, como dimensão, medidas, etc.) definido para a empresa como um todo. Com isso, o usuário pode projetar e desenvolver soluções que suportem fazer análises nos processos de negócios para vendas cruzadas. Você pode aprender mais sobrea matriz aqui.
para uma pessoa que quer fazer uma carreira no Data Warehouse e Business Intelligence domain, eu recomendaria estudar os livros de Bill Inmon (Building the Data Warehouse e Dw 2.0: The Architecture for the Next Generation of Data Warehousing) e o Livro de Ralph Kimball (the Microsoft Data Warehouse Toolkit).
Próximos Passos
- ReviewMicrosoft SQL Server Business Intelligence – o Que, Por que e Como – Parte 1.
- ReviewMicrosoft SQL Server Business Intelligence System Architecture-Parte 2.
- confira todos os sql Server Business Intelligence dicas sobre MSSQLTips.com.
Atualizada: 2013-06-24
Sobre o autor
ver todas as minhas dicas
- mais dicas de Business Intelligence…