Porovnání metodik návrhu datového skladu pro Microsoft SQL Server

Autor: Arshad Ali / Aktualizováno: 2013-06-24 / Komentáře (9) / související: > vývoj analytických služeb

problém

v posledních několika tipech jsem hovořil o důležitosti řešení Business Intelligence, proč se stává prioritou forexecutives, jak vypadá typická architektura systému Business Intelligence atd. V tomto tipu budu hovořit detailněo tom, jak se datový sklad liší od provozního úložiště dat a různých metodik návrhu datového skladu.

řešení

tento tip se bude týkat datových skladů (DW, někdy také nazývaných Enterprise Data Warehouse nebo EDW), jak se liší od Operational Data Store (ODS) a různých metodik návrhu datového skladu.

Enterprise Data Warehouse (EDW nebo DW) Vs. Operational Data Store (ODS)

účelem datového skladu v celkové architektuře Business Intelligence je integrovat firemní data z různých heterogenních zdrojů dat, aby se usnadnilo hlášení o historických a trendových analýzách. Funguje jako centrální úložiště a obsahuje „jedinou verzi pravdy“ pro organizaci, která byla pečlivě sestavena z dat uložených v nesourodých Interních a externích operačních databázích\systémy. Pro lepší výkon budou většinou data v datovém skladu v de-normalizované formě, kterou lze kategorizovat do schémat hvězd nebo sněhových vloček (více o tom v dalším tipu).

účelem úložiště provozních dat (ODS) je integrovat firemní data z různých heterogenních zdrojů dat s cílem usnadnit provozní vykazování v reálném čase nebo téměř v reálném čase. Často data v ODS bude strukturována podobně jako zdrojové systémy, i když během integrace může zahrnovat čištění dat, odstranění duplikace a může uplatňovat obchodní pravidla k zajištění integrity dat. ODS má především integrovat data poměrně často na nejnižší granulární úrovni pro provozní vykazování ve scénáři integrace dat téměř v reálném čase. Za normálních okolností nebude ODS optimalizována pro historickou a trendovou analýzu na obrovském souboru dat.

shrňme si rozdíly mezi ODS a ODS:

  • ODS je určena pro provozní výkaznictví a podporuje aktuální nebo blízké požadavky na reporting v reálném čase, kdeasa DW je určena pro historickou a trendovou analýzu hlášení o velkém objemu dat
  • ODS je zaměřena na nízké granulární dotazy, zatímco DW se používá pro složité dotazy proti souhrnné úrovni nebo na agregovaná data
  • ODS poskytuje informace pro operativní, taktická rozhodnutí o aktuálním nebo blízkém získávání dat v reálném čase, kdeasa DW poskytuje zpětnou vazbu pro strategická rozhodnutí vedoucí k celkovému zlepšení systému
  • v ODS frekvence načítání dat může být Hodinová nebo denní, zatímco v DW frekvence načítání dat může být denní, týdenní, měsíční nebo čtvrtletní

metodiky návrhu datového skladu

při navrhování řešení datového skladu se obvykle používají dvě různé metodiky a na základě požadavků vašeho projektu si můžete vybrat, který z nich vyhovuje vašemu konkrétnímu scénáři. Tyto metodiky jsouvýsledek výzkumu Billinmona a Ralpha Kimballa.

Bill Inmon-Top-down Data Warehouse Design Approach

Bill Inmon je někdy také označován jako „otec datového skladu“; jeho metodika návrhu je založena na přístupu shora dolů a definuje datový sklad v těchto termínech

  • Subjektově orientovaný-data v datovém skladu jsou kategorizována na základě oblasti předmětu, a proto jsou „předmětově orientovaná“.
  • Integrated – Data jsou integrována z různých nesourodých zdrojů dat a tím i univerzálních konvencí pojmenování, měření, klasifikací a tak dále používaných v datovém skladu. Datový sklad poskytuje podnikový konsolidovaný pohled na data, a proto je označen jako integrované řešení.
  • Non-volatile-jakmile jsou data integrována\načtena do datového skladu, lze je pouze číst. Uživatelé nemohou provádět změny v datech, a tohlepraxe činí data nestálými.
  • časová varianta – nakonec jsou data uložena po dlouhou dobu kvantifikovaná v letech a mají datum a časové razítko, a proto je popisována jako „časová varianta“.

Bill Inmon viděl potřebu integrovat data z různých systémů OLTP do centralizovaného úložiště (tzv. Bill Inmon předpokládá datový sklad v centru „Corporate Information Factory“ (CIF), který poskytuje logický rámec pro poskytování business intelligence (BI), business analytics a funkce řízení podniku.

 Enterprise Data Warehouse (EDW nebo DW) Vs. Operační úložiště dat (ODS)

tento návrh shora dolů poskytuje vysoce konzistentní dimenzionální pohled na data napříč datovými tržišti, protože všechny datové trhy jsou načteny z centralizovaného úložiště(datový sklad).Design shora dolů se také ukázal jako flexibilní pro podporu obchodních změn, protože vypadá v organizaci jako celku, ne v každé funkci nebo obchodním procesu organizace. Generování nových dimenzionálních datových tržišť proti datům uloženým v datovém skladu je relativně jednoduchý úkol. Ačkoli existují určité výzvy pro přístup shora dolů, například představuje velmi rozsáhlý projekt s velmi širokým rozsahem, a proto jsou počáteční náklady na implementaci datového skladu pomocí metodiky shora dolů významné.Dále může být značná doba od začátku projektu do okamžiku, kdy koncoví uživatelé začnou pociťovat počáteční výhody řešení. Metodika shora dolů může být také nepružná a nereaguje na měnící se potřeby oddělení nebo obchodních procesů (obavy z dnešního dynamicky se měnícího prostředí) během fáze implementace.

Ralph Kimball-Bottom-up Data Warehouse Design Approach

Ralph Kimball je renomovaný autor na téma datových skladů. Jeho metodika návrhu se nazývá dimenzionální modelování nebometodika Kimball. Tato metodika se zaměřuje na přístup zdola nahoru, s důrazem na hodnotu datového skladu pro uživatele co nejrychleji. Ve své vizi je datový sklad kopií transakčních dat speciálně strukturovaných pro analytické dotazování a podávání zpráv za účelem podpory systému podpory rozhodování. Podle jeho metodiky, datové Marty jsou firstcreated poskytovat reporting a analytické schopnosti pro specificbusiness\funkční procesy a později tyto datové Marty mohou nakonec beunioned společně vytvořit komplexní podnikový datový sklad. Přístup zdola nahoru se zaměřuje na každý obchodní proces v jednom okamžiku, takže návratnost investic by mohla být stejně rychlá jako první datový trh. I když, pokud není pečlivě plánováno, můžete postrádat velký obraz podnikového datového skladu tím, že chybí některé rozměry nebo vytvořením redundantních rozměrů atd. když jste příliš zaměřeni na individuální obchodní proces.

 metodiky návrhu datového skladu

přístup Ralpha Kimballa zdola nahoru navrhuje vytvořit obchodní matici, která by měla obsahovat všechny společné prvky (které používají datové trhy, jako je přizpůsobená\sdílená dimenze, opatření atd.).) definováno pro podnik jako celek. Díky tomu může uživatel navrhnout a vyvinout řešení, která podporují analýzu napříč obchodními procesy pro křížový prodej. Více se o matici dozvíte zde.

pro osobu, která chce udělat kariéru v oblasti datového skladu a Business Intelligence, bych doporučil studovat knihy Billa Inmona (budování datového skladu a DW 2.0: architektura pro příští generaci datového skladu) a knihu Ralpha Kimballa (Microsoft Data Warehouse Toolkit).

další kroky
  • Recenzemicrosoft SQL Server Business Intelligence-co, proč a jak-Část 1.
  • Recenzemicrosoft SQL Server Business Intelligence System Architecture-Část 2.
  • podívejte se na všechny theSQL Server Business Intelligence tipy na MSSQLTips.com.

Poslední aktualizace: 2013-06-24

získat skripty

tlačítko Další tip

o autorovi
MSSQLTips autor Arshad AliArshad Ali je SQL a BI Developer se zaměřením na datové sklady projektů pro Microsoft.
Zobrazit všechny mé tipy
související zdroje

  • více Business Intelligence tipy…

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.