Comparing Data Warehouse Design Methodologies for Microsoft SQL Server

By: Arshad Ali | Updated: 2013-06-24 | Comments (9) | Related: > Analysis Services Development

Problem

in my last parina vinkkinä, I talk about the importance of a Business Intelligence solution, why it is becoming priority forexecutives, what a typical business intelligence järjestelmän arkkitehtuuri näyttää, jne. Tässä vinkissä aion puhua yksityiskohtaisesti siitä, miten tietovarasto eroaa operatiivisesta tietovarastosta ja tietovaraston eri suunnittelumenetelmistä.

ratkaisu

tämä kärki koskee tietovarastoja (Dw, joskus myös nimeltään Enterprise Data Warehouse tai EDW), miten se eroaa Operational Data Storesta (ODS) ja erilaisista tietovaraston suunnittelumenetelmistä.

Enterprise Data Warehouse (EDW tai DW) Vs. Operational Data Store (ODS)

yleisesti Business Intelligence-arkkitehtuurissa tietovaraston tarkoituksena on integroida yritysdataa eri heterogeenisista tietolähteistä historiallisen ja trendianalyysin raportoinnin helpottamiseksi. Se toimii keskusvarastona ja sisältää organisaation ”yhden version totuudesta”, joka on huolellisesti rakennettu erilaisista sisäisistä ja ulkoisista operatiivisista tietokannoista\systems tallennetuista tiedoista. Paremman suorituskyvyn vuoksi enimmäkseen tietovaraston tiedot ovat de-normalisoidussa muodossa, joka voidaan luokitella joko tähti-tai lumihiutale-skeemoihin (lisää tästä seuraavassa vinkissä).

Operation Data Storen (ODS) tarkoituksena on integroida eri heterogeenisista tietolähteistä saatuja yritystietoja reaaliaikaisen tai lähes reaaliaikaisen operatiivisen raportoinnin helpottamiseksi. Usein ODS-tieto on rakenteeltaan samanlainen kuin lähdejärjestelmät, joskin integraation aikana siihen voi sisältyä tietojen puhdistamista, päällekkäisyyksien poistamista ja liiketoimintasääntöjen soveltamista tietojen eheyden varmistamiseksi. ODS-järjestelmällä pyritään pääasiassa integroimaan tietoja melko usein operatiivisen raportoinnin alimmilla yksityiskohtaisilla tasoilla lähes reaaliaikaisen tiedon integrointiskenaariossa. Tavallisesti ODS: ää ei optimoida valtavien tietojen historialliseen ja trendianalyysiin.

tiivistetäänpä ODS: n ja DW: n erot:

  • ODS on tarkoitettu operatiiviseen raportointiin ja tukee nykyisiä tai lähes reaaliaikaisia raportointivaatimuksia, joissaasa DW on tarkoitettu historiallis-ja trendianalyysiin raportointiin suuresta tietomäärästä
  • ja ODS on suunnattu matalarakeisiin kyselyihin, kun taas DW: tä käytetään monimutkaisiin kyselyihin yhteenvetotasoista tai aggregoiduista tiedoista
  • . DW antaa palautetta strategisista päätöksistä, jotka johtavat järjestelmän kokonaisparannuksiin
  • datakuormitustiheys voi olla tunti-tai vuorokausirytmi, kun taas Dw: ssä datakuormitustiheys voi olla päivittäinen, viikoittainen, kuukausittainen tai neljännesvuosittainen

tietovaraston suunnittelumenetelmät

tietovaraston ratkaisua suunniteltaessa on tavallisesti kaksi erilaista menetelmää, ja projektisi vaatimusten perusteella voit valita, mikä niistä sopii juuri sinun skenaarioihisi. Nämä menetelmät ovat tulosta Billinmonin ja Ralph Kimballin tutkimuksista.

Bill Inmon – Top-down Data Warehouse Design Approach

Bill Inmonia kutsutaan joskus myös ”tietovaraston isäksi”; hänen suunnittelumetodologiansa perustuu ylhäältä alas-lähestymistapaan ja määrittelee tietovaraston näillä termeillä

  • Subjektiorientoitunut – tietovaraston tiedot luokitellaan subjektin perusteella ja siten se on ”subjektiorientoitunut”.
  • integroitu – tieto integroidaan erilaisista tietolähteistä ja siten yleisistä nimeämiskäytännöistä, mittauksista, luokituksista ja niin edelleen, joita käytetään tietovarastossa. Tietovarasto tarjoaa yrityksen konsolidoidun näkemyksen tiedoista, ja siksi se on nimetty integroiduksi ratkaisuksi.
  • haihtumaton-kun tieto on integroitu\ladattu tietovarastoon, se voidaan vain lukea. Käyttäjät eivät voi tehdä muutoksia tietoihin, ja tämä käytäntö tekee tiedoista haihtumattomia.
  • Aikamuunnos – lopuksi tietoja säilytetään pitkiä aikoja kvantifioituina vuosina, ja niillä on päivämäärä ja aikaleima, minkä vuoksi niitä kutsutaan ”aikamuunnoksiksi”.

Bill Inmon näki tarpeelliseksi integroida tietoja eri OLTP-järjestelmistä keskitettyyn arkistoon (calleda data warehouse) niin sanotulla ylhäältä alas-lähestymistavalla. Bill Inmon visioi ”Corporate Information Factoryn” (CIF) keskelle tietovarastoa, joka tarjoaa loogiset puitteet business intelligence (BI) -, business analytics-ja business management-ominaisuuksien toimittamiselle.

 Enterprise Data Warehouse (EDW tai DW) Vs. Operational Data Store (ODS)

tämä ylhäältä alas muotoilu tarjoaa erittäin yhdenmukaisen mittanäkymän datasta datamyymälöissä, koska kaikki datamyymälät Ladataan keskitetystä arkistosta (tietovarasto).Ylhäältä alas-suunnittelu on myös osoittautunut joustavaksi tukemaan liiketoiminnan muutoksia, koska se näyttää organisaation koko, ei kunkin toiminnon tai liiketoimintaprosessin organisaation. Uuden ulottuvuusdatan luominen tietovarastoon tallennettuja tietoja vastaan on suhteellisen yksinkertainen tehtävä. Vaikka ylhäältä alas-lähestymistavalla on joitakin haasteita, se on esimerkiksi erittäin suuri hanke, jolla on hyvin laaja soveltamisala, ja siksi ylhäältä alas-menetelmää käyttävän tietovaraston toteuttamiskustannukset ovat merkittävät.Lisäksi aika projektin alusta siihen pisteeseen, että loppukäyttäjät alkavat kokea ratkaisun alustavia hyötyjä, voi olla huomattava. Myös ylhäältä alas-menetelmä voi olla joustamaton ja reagoimaton muuttuviin osastojen tai liiketoimintaprosessien tarpeisiin (huoli nykypäivän dynaamisesti muuttuvassa ympäristössä) toteutusvaiheen aikana.

Ralph Kimball-Bottom-up Data Warehouse Design Approach

Ralph Kimball on tunnettu kirjailija, joka käsittelee tietovarastointia. Hänen suunnittelumenetelmäänsä kutsutaan dimensional modelingiksi tai Kimball-metodologiaksi. Tässä menetelmässä keskitytään alhaalta ylöspäin suuntautuvaan lähestymistapaan ja korostetaan tietovaraston arvoa käyttäjille mahdollisimman nopeasti. Hänen visiossaan tietovarasto on kopio tapahtumatiedoista, jotka on erityisesti rakennettu analyyttiseen kyselyyn ja raportointiin päätöksenteon tukijärjestelmän tueksi. Hänen metodologiansa mukaisesti data marts on ensin luotu tarjoamaan raportointi-ja analyyttisiä valmiuksia tiettyihin liiketoiminnan \ funktionaalisiin prosesseihin ja myöhemmin nämä data martsit voidaan lopulta yhdistää kokonaisvaltaisen yrityksen tietovaraston luomiseksi. Alhaalta ylöspäin suuntautuvassa lähestymistavassa keskitytään kuhunkin liiketoimintaprosessiin jossain vaiheessa sijoitetun pääoman tuotto voi olla yhtä nopea kuin ensimmäinen data mart syntyy. Vaikka ei huolellisesti suunniteltu, saatat puuttuu kokonaiskuva yrityksen tietovaraston puuttumalla joitakin ulottuvuuksia tai luomalla tarpeettomia ulottuvuuksia, jne. kun olet liian keskittynyt yksittäiseen liiketoimintaprosessiin.

tietovaraston suunnittelumenetelmät

Ralph Kimballin alhaalta ylöspäin suuntautuva lähestymistapa ehdottaa liiketoimintamatriisin luomista, joka sisältäisi kaikki yhteiset elementit (joita käytetään datamarketeissa, kuten conformed\shared dimension, measures, jne.) määritellään koko yritykselle. Tämän avulla käyttäjä voi suunnitella ja kehittää ratkaisuja, jotka tukevat analyysien tekemistä eri liiketoimintaprosesseissa ristiinmyyntiä varten. Voit lukea lisää Matrixista täältä.

henkilölle, joka haluaa tehdä uran tietovaraston ja Business Intelligence domainin parissa, suosittelisin tutkimaan Bill Inmonin kirjoja (Building the Data Warehouse and DW 2.0: The Architecture for the Next Generation of Data Warehousing) ja Ralph Kimballin kirjaa (the Microsoft Data Warehouse Toolkit).

Next Steps
  • ReviewMicrosoft SQL Server Business Intelligence-mitä, miksi ja miten-osa 1.
  • ReviewMicrosoft SQL Server Business Intelligence System Architecture-Part 2.
  • Tsekkaa kaikki theSQL Server Business Intelligence-vinkit MSSQLTips.com.

viimeksi päivitetty: 2013-06-24

Hae skriptejä

seuraava vihjepainike

tietoa tekijästä
kirjoittaja Arshad AliArshad Ali on SQL-ja BI-kehittäjä, joka keskittyy Tietovarastointiprojekteihin Microsoftille.
Katso kaikki omat vinkkini
Aiheeseen liittyvät resurssit

  • lisää Business Intelligence-vinkkejä…

Vastaa

Sähköpostiosoitettasi ei julkaista.