Comparing Data Warehouse Design Methodologies for Microsoft SQL Server

By: Arshad Ali | Updated: 2013-06-24 | Comments (9) | Related: > Analysis Services Development

Problem
rozwiązanie

ta wskazówka obejmie Hurtownie danych (DW, czasami nazywane również Enterprise Data Warehouse lub EDW), czym różni się od Operational Data Store (ODS) i różnych metod projektowania hurtowni danych.

Enterprise Data Warehouse (EDW lub DW) Vs. Operational Data Store (ODS)

celem hurtowni danych w ogólnej architekturze Business Intelligence jest integracja danych korporacyjnych z różnych heterogenicznych źródeł danych w celu ułatwienia raportowania analiz historycznych i trendów. Działa jako centralne repozytorium i zawiera „jedną wersję prawdy”dla organizacji, która została starannie skonstruowana z danych przechowywanych w różnych wewnętrznych i zewnętrznych bazach danych\systemów operacyjnych. Dla lepszej wydajności, głównie dane w hurtowni danych będą w formie zdestormalizowanej, która może być klasyfikowana w schematach gwiazdy lub płatka śniegu (więcej na ten temat w następnej poradzie).

celem Operation Data Store (ODS) jest integracja danych korporacyjnych z różnych heterogenicznych źródeł danych w celu ułatwienia raportowania operacyjnego w czasie rzeczywistym lub w czasie zbliżonym do rzeczywistego. Często dane w ODS będą miały strukturę podobną do systemów źródłowych, chociaż podczas integracji mogą obejmować czyszczenie danych, duplikację i mogą stosować reguły biznesowe w celu zapewnienia integralności danych. ODS ma głównie na celu dość częstą integrację danych na najniższym poziomie szczegółowym dla raportowania operacyjnego w scenariuszu integracji danych w czasie zbliżonym do rzeczywistego. Zwykle ODS nie będzie zoptymalizowany pod kątem analizy historycznej i trendów na ogromnym zestawie danych.

podsumujmy różnice między ODS i DW:

  • ODS jest przeznaczony do raportowania operacyjnego i obsługuje bieżące lub prawie aktualne wymagania raportowania w czasie rzeczywistym, gdzieasa DW jest przeznaczony do analizy historycznej i trendów raportowania na dużej ilości danych
  • ODS jest przeznaczony do zapytań o niskim poziomie ziarnistości, podczas gdy DW jest używany do złożonych zapytań na poziomie podsumowania lub danych zagregowanych
  • ODS dostarcza informacji do decyzji operacyjnych, taktycznych dotyczących bieżącego lub prawie rzeczywistego pozyskiwania danych whereasa DW dostarcza informacji zwrotnych dla strategicznych decyzji prowadzących do ogólnej poprawy systemu
  • w ODS częstotliwość ładowania danych może być godzinowa lub dzienna, podczas gdy w dwczęstotliwość ładowania danych może być dzienna, tygodniowa, miesięczna lub kwartalna

Metodologia projektowania hurtowni danych

przy projektowaniu rozwiązania hurtowni danych zwykle stosuje się dwie różne metody i w oparciu o wymagania projektu możesz wybrać, która z nich pasuje do twojego konkretnego scenariusza. Metodologia ta jest wynikiem badań Billinmona i Ralpha Kimballa.

Bill Inmon – odgórne podejście do projektowania hurtowni danych

Bill Inmon jest czasami nazywany „ojcem hurtowni danych”; jego metodologia projektowania opiera się na podejściu odgórnym i definiuje hurtownię danych w tych terminach

  • zorientowana na temat-dane w hurtowni danych są kategoryzowane na podstawie obszaru tematycznego, a zatem są „zorientowane na temat”.
  • Integrated-dane są integrowane z różnych różnych źródeł danych, a zatem uniwersalne konwencje nazewnictwa, pomiary, klasyfikacje itp.stosowane w hurtowni danych. Hurtownia danych zapewnia skonsolidowany widok danych przedsiębiorstwa i dlatego jest oznaczona jako zintegrowane rozwiązanie asan.
  • nieulotny-Po zintegrowaniu danych\załadowaniu do hurtowni danych można je tylko odczytać. Użytkownicy nie mogą wprowadzać zmian w danych, a ta praktyka sprawia, że dane nie ulegają zmianie.
  • wariant czasowy-w końcu dane są przechowywane przez długie okresy czasu określone w latach i mają datę i znacznik czasu i dlatego są opisywane jako „wariant czasowy”.

Bill Inmon dostrzegł potrzebę integracji danych z różnych systemów OLTP w scentralizowane repozytorium (zwane hurtownią danych) z tzw. podejściem odgórnym. Bill Inmon przewiduje hurtownię danych w centrum „Corporate information Factory” (CIF), który zapewnia logiczne ramy dla dostarczania Business intelligence (BI), analityki biznesowej i możliwości zarządzania firmą.

 Enterprise Data Warehouse (EDW lub DW) Vs. Magazyn danych operacyjnych (ODS)

ta konstrukcja z góry na dół zapewnia wysoce spójny widok wymiarowy danych w martach danych, ponieważ wszystkie Marty danych są ładowane ze scentralizowanego repozytorium (Hurtownia danych).Konstrukcja odgórna okazała się również elastyczna, aby wspierać zmiany biznesowe, ponieważ wygląda na organizację jako całość, a nie na każdą funkcję lub proces biznesowy organizacji. Generowanie nowych wymiarów danych na podstawie danych przechowywanych w hurtowni danych jest stosunkowo prostym zadaniem. Chociaż istnieją pewne wyzwania dla podejścia odgórnego, na przykład stanowi ono bardzo duży projekt o bardzo szerokim zakresie, a zatem koszt wdrożenia hurtowni danych przy użyciu metodyki odgórnej jest znaczący.Ponadto czas trwania od rozpoczęcia projektu do momentu, w którym użytkownicy końcowi zaczynają odczuwać początkowe korzyści z rozwiązania, może być znaczny. Ponadto metodologia odgórna może być nieelastyczna i nie reagować na zmieniające się potrzeby departamentów lub procesów biznesowych (troska o dzisiejsze dynamicznie zmieniające się środowisko) w fazie wdrożenia.

Ralph Kimball – oddolne podejście do projektowania hurtowni danych

Ralph Kimball jest uznanym autorem na temat hurtowni danych. Jego metodologia projektowania nazywa się modelowaniem wymiarowym lub metodologią Kimballa. Metodologia ta koncentruje się na podejściu oddolnym, podkreślając wartość hurtowni danych dla użytkowników tak szybko, jak to możliwe. W jego wizji hurtownia danych jest kopią danych transakcyjnych specjalnie skonstruowanych na potrzeby zapytań analitycznych i raportowania w celu wsparcia systemu wspomagania decyzji. Zgodnie z jego metodologią, data marts są najpierw tworzone w celu zapewnienia możliwości raportowania i analitycznych dla konkretnych procesów biznesowych\funkcjonalnych, a później te data marts mogą ostatecznie zostać połączone w celu stworzenia kompleksowej hurtowni danych przedsiębiorstwa. Podejście oddolne koncentruje się na każdym procesie biznesowym w jednym momencie, więc zwrot z inwestycji może być tak szybki, jak powstaje first data mart. Jeśli jednak nie jest to dokładnie zaplanowane, może brakować ogólnego obrazu hurtowni danych przedsiębiorstwa, ponieważ brakuje niektórych wymiarów lub tworzy się nadmiarowe wymiary itp. gdy jesteś zbyt skoncentrowany na indywidualnym procesie biznesowym.

metodologie projektowania hurtowni danych

oddolne podejście Ralpha Kimballa proponuje stworzenie macierzy biznesowej, która powinna zawierać wszystkie wspólne elementy (które są używane przez Marty danych, takie jak conformed\shared dimension, measures itp.) zdefiniowanych dla przedsiębiorstwa jako całości. Dzięki temu użytkownik może projektować i rozwijać rozwiązania, które wspierają Przeprowadzanie analiz w procesach biznesowych w celu sprzedaży krzyżowej. Możesz dowiedzieć się więcej o matrycy tutaj.

dla osoby, która chce zrobić karierę w hurtowni danych i domenie Business Intelligence, polecam studiowanie książek Billa Inmona (Building the Data Warehouse and DW 2.0: The Architecture for the Next Generation of Data Warehousing) oraz książki Ralpha Kimballa (Microsoft Data Warehouse Toolkit).

kolejne kroki
  • Recenzjemicrosoft SQL Server Business Intelligence – co, dlaczego i jak – Część 1.
  • Recenzjemicrosoft SQL Server Business Intelligence Architektura systemu-część 2.
  • sprawdź wszystkie porady Business Intelligence serwera QL dotyczące MSSQLTips.com.

Ostatnia aktualizacja: 2013-06-24

Pobierz Skrypty

przycisk Next tip

o autorze
MSSQLTips autor Arshad Ali Arshad Ali jest programistą SQL i BI, koncentrującym się na projektach hurtowni danych dla Microsoft.
Zobacz wszystkie moje porady
powiązane zasoby

  • więcej porad Business Intelligence…

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.