article

Datawarehousing: is het de investering waard?

The author of this articleLuke Stolzenbach - Project Consultant
De ontwikkelingen op het gebied van business intelligence zijn de afgelopen jaren enorm. Mede door de opkomst van self-service BI-tools zet men vraagtekens bij het investeren in een datawarehouse. Is het inrichten van een datawarehouse nog wel de moeite waard?

Datawarehousing

Datawarehousing is een veelomvattend begrip dat breed wordt gebruikt en daarom lastig is om een duidelijke definitie van te geven. De geestelijk vader van datawarehousing “Bill Inmon” omschrijft datawarehousing als volgt:

Datawarehousing is een onderwerp georiënteerde, geïntegreerde, tijdsafhankelijke gegevensverzameling die aan de basis ligt van managementbeslissingen.
Inmon, 1992

In deze definitie slaat Inmon de spijker op de kop. Het uiteindelijke doel waar een datawarehouse voor wordt ingezet, is in onze ogen dan ook om het nemen van managementbeslissingen te ondersteunen of zelfs te initiëren. Hiermee ligt datawarehousing aan de basis van business intelligence (BI). 
 
Om BI en datawarehousing uit te leggen zou je BI kunnen zien als een kubus: een achterkant, binnenkant, voorkant en zijkant. De achterkant heeft betrekking op de systemen die de data aanleveren, bijvoorbeeld een ERP-systeem. De binnenkant is de datawarehouse. De voorkant heeft betrekking op de presentatie van de data, hiervoor worden veelvuldig programma’s als Power BI, Qlikview en Tableau gebruikt. De zijkant heeft tot slot betrekking op het beheer.

Waarom is een datawarehouse nuttig?

Een datawarehouse die op de juiste manier is opgezet, geeft veel voordelen. In dit artikel bespreken we vier van de meest voorkomende, namelijk: meer flexibiliteit, optimalisatie van de data governance, betere datakwaliteit en waarborging van historische data.

  1. Een datawarehouse vergroot de flexibiliteit
    Een datawarehouse stelt de eindgebruikers in staat om op een zeer flexibele en efficiënte manier data te rapporteren. Door bijvoorbeeld de datum dimensie te gebruiken wordt het mogelijk om met een enkele muisknop te springen van jaar naar kwartaal naar maand naar dag. Het wordt als het ware mogelijk om op een flexibele en snelle manier door de data te manoeuvreren. Daarnaast is het niet meer nodig om handmatig uit iedere bron de gewenste data te halen en deze vervolgens samen te voegen. Dit is namelijk in het ETL (extract transform and load)-proces al gebeurd. Het ETL-proces zorgt ervoor dat de data vanuit de databronnen in het datawarehouse terecht komt.
     
  2. Een datawarehouse optimaliseert de datagovernance
    Herkent u de meetings waarin een groot deel van de tijd voorbij gaat aan overeenstemming krijgen over welke data juist is en wat de betekenis daarvan is? Een datawarehouse kan hierbij helpen. In een datawarehouse komt ieder datapunt één keer voor. Er is bijvoorbeeld maar één lijst met artikelen die in het assortiment zitten. Waar voorheen afdeling verkoop en marketing over verschillende lijsten beschikten, is er door het datawarehouse één waarheid gecreëerd. Dit voorkomt discussies tussen beide afdelingen. Daarnaast is begripsvorming een belangrijk onderdeel bij het opzetten van een datawarehouse. Aangeraden wordt om een wikipagina bij te houden met daarin alle definities zodat iedereen weet wat de data precies betekent.
     
  3. Een datawarehouse leidt tot hogere datakwaliteit
    Veel ondernemingen denken dat de data goed op orde is, totdat zij een datawarehouse gaan gebruiken. Want dan moet er één waarheid in de data gecreëerd worden en moet er overeenstemming tussen de afdelingen komen over de inhoud. Zo wordt een organisatie bij het opzetten van een datawarehouse gedwongen om in de data te graven en te beoordelen of de data compleet en logisch is. De kwaliteit van de gegevens moet vervolgens stap voor stap structureel worden verbeterd.
     
  4. Een datawarehouse ondersteunt bij de waarborging van historische data
    Veelal houden de bronsystemen, waarin data wordt opgeslagen, niet altijd op een gewenste manier de historie bij. Wanneer bijvoorbeeld een debiteur verhuist naar een andere regio, verander je het adres in het debiteurenbestand. Het is echter niet altijd zo dat het debiteurenbestand het vorige adres onthoudt. Bij het analyseren van data kan echter de historische data van groot belang zijn. Om bijvoorbeeld de omzetverdeling over de regio’s van vorig jaar te vergelijken met de omzetverdeling in het huidige jaar, zijn bijvoorbeeld historische adresgegevens cruciaal. Een datawarehouse kan er voor zorgen dat wijzigingen in de databronnen op de gewenste manier vastgehouden worden. Bij de inrichting van een datawarehouse wordt namelijk beoordeeld op welke manier historische data bewaard moet blijven. Er kan voor gekozen worden om alle data te overschrijven en geen historie bij te houden of om alle historie bij te houden. Ook een middenweg zoals de huidige en vorige waarde is mogelijk. Aangezien dataopslag niet gratis is kan dit in sommige gevallen gewenst zijn. Steeds vaker zal echter gekozen worden om alle historische data te bewaren, dit aangezien de trend is dat dataopslag goedkoper wordt.

Bijkomend voordeel

Naast de vier eerder genoemde voordelen is er nog een belangrijk voordeel te benoemen. Zo is sinds 2018 de regelgeving omtrent AVG een belangrijk item om rekening mee te houden gezien de hoogte van de boetes (4% jaaromzet of 20 miljoen euro) die worden uitgedeeld bij het niet nakomen ervan. Middels een datawarehouse blijft de data gestructureerd, kan de data goed beheerd worden vanuit een centrale afdeling en kunnen eventuele datalekken of andere vormen van ongelukkig gebruik van data worden voorkomen.

Een toegevoegde waarde voor de organisatie

De genoemde punten kunnen ook bij gebruik van een self-service BI-tool als voordeel benoemd worden, maar in de praktijk blijkt de borging hiervan toch een heel stuk lastiger dan via een datawarehouse. Waar een datawarehouse voornamelijk beheerd wordt door IT of een centrale data-afdeling is een self-service BI-tool veelal toegankelijk voor meerdere gebruikers binnen de organisatie. Om tot eenzelfde resultaat te komen moeten afspraken gemaakt worden, specifieke rechten worden ontleend en vergt het veel discipline om dit op hetzelfde niveau te krijgen als via een datawarehouse.

Het inrichten van een datawarehouse vergt een investering, maar kan bij een goede inrichting zeker de moeite waard zijn.

Our other sites

The author of this articleLuke Stolzenbach - Project Consultant

Grow your career

Come join us

Expand your business

Let's work together

Sign up for the latest industry insights
Set preferences