Comparing Data Warehouse Design Methodologies for Microsoft SQL Server

By: Arshad Ali / Updated: 2013-06-24 | Comments (9) | Related: > Analysis Services Development

Problem

In mijn laatste paar tips sprak ik over het belang van een Business Intelligence-oplossing, waarom het prioriteit wordt voor forexecutives, hoe een typische Business Intelligence systeemarchitectuur eruit ziet, etc. In deze tip ga ik in detail bespreken hoe een datawarehouse verschilt van operationele dataopslag en de verschillende ontwerpmethodologieën voor een datawarehouse.

oplossing

deze tip zal betrekking hebben op datawarehouses (DW, soms ook calledan Enterprise Data Warehouse of EDW), hoe het verschilt van Operational Data Store (ODS) en verschillende datawarehouse ontwerpmethoden.

Enterprise Data Warehouse (EDW of DW) Vs. Operational Data Store (ODS)

het doel van het datawarehouse in de Algemene Business Intelligence-architectuur is het integreren van bedrijfsgegevens uit verschillende heterogene gegevensbronnen om historische en trendanalyseverslagen te vergemakkelijken. Het fungeert als een centrale repository en bevat de “enkele versie van waarheid” voor de organisatie die zorgvuldig is opgebouwd uit gegevens die zijn opgeslagen in ongelijksoortige interne en externe operationele databases\systemen. Voor betere prestaties, meestal gegevens in data warehouse zal worden in de-genormaliseerde vorm die kan worden gecategoriseerd in een ster of sneeuwvlok schema (meer hierover in de volgende tip).

het doel van de “Operation Data Store” (ODS) is het integreren van bedrijfsgegevens uit verschillende heterogene gegevensbronnen om realtime of bijna realtime operationele rapportage te vergemakkelijken. Vaak zullen gegevens in de ODS gestructureerd zijn als de bronsystemen, hoewel het tijdens de integratie kan gaan om gegevensreiniging, de-duplicatie en bedrijfsregels kan toepassen om de integriteit van gegevens te waarborgen. Een ODS is voornamelijk bedoeld om gegevens vrij vaak te integreren op het laagste granulaire niveau voor operationele rapportage in een dicht bij real-time data-integratie scenario. Normaal gesproken zal een ODS niet worden geoptimaliseerd voor historische en trendanalyse op enorme set gegevens.

laten we de verschillen tussen een ODS en DW samenvatten:

  • een ODS is bedoeld voor operationele rapportage en ondersteunt huidige of bijna real-time rapportagevereisten waareasa DW is bedoeld voor historische en trendanalyse rapportage over een grote hoeveelheid gegevens
  • een ODS is gericht op laagkorrelige query ’s terwijl een DW wordt gebruikt voor complexe query’ s tegen samenvattingsniveau of op geaggregeerde gegevens
  • een ODS geeft informatie voor operationele, tactische beslissingen over huidige of bijna real-time data-acquisitie waareasa DW feedback levert voor strategische beslissingen die leiden tot systeemverbeteringen
  • in een ODS de de frequentie van de gegevensbelasting kan per uur of per dag zijn, terwijl in een Dwde frequentie van de gegevensbelasting dagelijks, wekelijks, maandelijks of driemaandelijks

methodologieën voor het ontwerpen van datawarehouses

er zijn twee verschillende methodologieën die gewoonlijk worden gevolgd bij het ontwerpen van een datawarehouse-oplossing en op basis van de vereisten van uw project kunt u kiezen welke bij uw specifieke scenario past. Deze methodologieën zijn het resultaat van onderzoek van BillInmon en Ralph Kimball.

Bill Inmon-Top-down Data Warehouse Design Approach

Bill Inmon wordt soms ook wel de “vader van data warehousing” genoemd; zijn ontwerpmethodologie is gebaseerd op een top-down benadering en definieert data warehouse in deze termen

  • onderwerp – georiënteerd-de gegevens in een data warehouse worden gecategoriseerd op basis van het onderwerp en daarom is het “onderwerp-georiënteerd”.
  • geà ntegreerd-gegevens worden geà ntegreerd uit verschillende uiteenlopende gegevensbronnen en dus universele naamgevingsconventies, metingen, classificaties enzovoort die in het datawarehouse worden gebruikt. Het datawarehouse biedt een bedrijf geconsolideerde weergave van de gegevens en daarom is het aangewezen als een geïntegreerde oplossing.
  • niet-vluchtig-zodra de gegevens zijn geïntegreerd \ geladen in het datawarehouse kan het alleen worden gelezen. Gebruikers kunnen geen wijzigingen aan de gegevens aanbrengen en deze praktijk maakt de gegevens niet-vluchtig.
  • Tijdvariant-ten slotte worden gegevens opgeslagen voor lange tijdsperioden gekwantificeerd in jaren en hebben een datum en tijdstempel en worden daarom beschreven als “tijdvariant”.

Bill Inmon zag de noodzaak om gegevens van verschillende OLTP-systemen te integreren in een gecentraliseerde repository (calleda data warehouse) met een zogenaamde top-down aanpak. Bill Inmon voorziet in een datawarehouse in het centrum van de “Corporate Information Factory” (CIF), die een logisch kader biedt voor het leveren van business intelligence (BI), business analytics en business management mogelijkheden.

Enterprise Data Warehouse (EDW of DW) Vs. Operational Data Store (ODS))

dit top-down ontwerp biedt een zeer consistente dimensionale weergave van gegevens over data marts als alle data marts worden geladen vanuit de gecentraliseerde repository (Data Warehouse).Het top-down ontwerp is ook flexibel gebleken om zakelijke veranderingen te ondersteunen als het kijkt naar de organisatie als geheel, niet bij elke functie of bedrijfsproces van de organisatie. Het genereren van een nieuwe dimensionale data marts tegen de gegevens die zijn opgeslagen in datawarehouse is een relatief eenvoudige taak. Hoewel er een aantal uitdagingen zijn voor de top-down aanpak, is het bijvoorbeeld een zeer groot project met een zeer breed toepassingsgebied en daarom zijn de up-front kosten voor het implementeren van een datawarehouse met behulp van de top-down methodologie aanzienlijk.Verder, de duur van de tijd vanaf de start van het project tot het punt dat eindgebruikers beginnen ervaring initiële voordelen van de oplossing kan aanzienlijk zijn. Ook kan de top-down methodologie inflexibel zijn en niet reageren op veranderende behoeften van afdelingen of bedrijfsprocessen (een zorg voor de huidige dynamisch veranderende omgeving) tijdens de implementatiefase. Ralph Kimball-Bottom-up Data Warehouse Design Approach

Ralph Kimball is een gerenommeerd auteur over data warehousing. Zijn ontwerpmethodologie heet dimensional modeling of de Kimball-methodologie. Deze methodologie richt zich op een bottom-up benadering, waarbij de waarde van het datawarehouse voor de gebruikers zo snel mogelijk wordt benadrukt. In zijn visie is een datawarehouse de kopie van de transactiegegevens die specifiek zijn gestructureerd voor analytisch bevragen en rapporteren om het beslissingsondersteunend systeem te ondersteunen. Volgens zijn methodologie, data marts worden eerstgecreëerd om rapportage en analytische mogelijkheden voor specifieke business\functionele processen te bieden en later kunnen deze data marts uiteindelijk samen wordenunioned om een uitgebreid enterprise Data warehouse te creëren. De bottom-up aanpak richt zich op elk bedrijfsproces op een punt van de timeso het rendement op de investering kan zo snel zijn als first data mart wordt gemaakt. Hoewel als niet zorgvuldig gepland, je zou kunnen missen het grote beeld van de enterprise data warehouse door het missen van een aantal dimensies of door het creëren van redundante dimensies, enz. wanneer u te gefocust op een individueel bedrijfsproces.

Data Warehouse Design Methodologies

Ralph Kimball ‘ s bottom-up approach stelt voor om een business matrix te creëren die alle gemeenschappelijke elementen moet bevatten (die worden gebruikt door data marts zoals conformed \ shared dimension, measures, etc.) gedefinieerd voor de onderneming als geheel. Hiermee kan de gebruiker oplossingen ontwerpen en ontwikkelen die analyses ondersteunen in de bedrijfsprocessen voor cross selling. Meer informatie over de matrix vindt u hier.

voor iemand die carrière wil maken in het Data Warehouse en Business Intelligence domein, zou ik aanraden om Bill Inmon ’s boeken (Building the Data Warehouse en DW 2.0: The Architecture for the Next Generation of Data Warehousing) en Ralph Kimball’ s boek (The Microsoft Data Warehouse Toolkit) te bestuderen.

volgende stappen
  • ReviewMicrosoft SQL Server Business Intelligence – wat, waarom en hoe-deel 1.
  • ReviewMicrosoft SQL Server Business Intelligence System Architecture-Part 2.
  • bekijk al theSQL Server Business Intelligence tips op MSSQLTips.com.

Laatst Bijgewerkt: 2013-06-24

voor scripts

de volgende tip knop

Over de auteur
MSSQLTips auteur Arshad AliArshad Ali is een SQL-en BI Ontwikkelaar gericht op datawarehousing projecten voor Microsoft.
View all my tips
Related Resources

  • More Business Intelligence Tips…

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.