Datawarehousing is een veelomvattend begrip dat breed wordt gebruikt en daarom lastig is om een duidelijke definitie van te geven. De geestelijk vader van datawarehousing “Bill Inmon” omschrijft datawarehousing als volgt:
Datawarehousing is een onderwerp georiënteerde, geïntegreerde, tijdsafhankelijke gegevensverzameling die aan de basis ligt van managementbeslissingen.Inmon, 1992
In deze definitie slaat Inmon de spijker op de kop. Het uiteindelijke doel waar een datawarehouse voor wordt ingezet, is in onze ogen dan ook om het nemen van managementbeslissingen te ondersteunen of zelfs te initiëren. Hiermee ligt datawarehousing aan de basis van business intelligence (BI).
Om BI en datawarehousing uit te leggen zou je BI kunnen zien als een kubus: een achterkant, binnenkant, voorkant en zijkant. De achterkant heeft betrekking op de systemen die de data aanleveren, bijvoorbeeld een ERP-systeem. De binnenkant is de datawarehouse. De voorkant heeft betrekking op de presentatie van de data, hiervoor worden veelvuldig programma’s als Power BI, Qlikview en Tableau gebruikt. De zijkant heeft tot slot betrekking op het beheer.
Een datawarehouse die op de juiste manier is opgezet, geeft veel voordelen. In dit artikel bespreken we vier van de meest voorkomende, namelijk: meer flexibiliteit, optimalisatie van de data governance, betere datakwaliteit en waarborging van historische data.
Naast de vier eerder genoemde voordelen is er nog een belangrijk voordeel te benoemen. Zo is sinds 2018 de regelgeving omtrent AVG een belangrijk item om rekening mee te houden gezien de hoogte van de boetes (4% jaaromzet of 20 miljoen euro) die worden uitgedeeld bij het niet nakomen ervan. Middels een datawarehouse blijft de data gestructureerd, kan de data goed beheerd worden vanuit een centrale afdeling en kunnen eventuele datalekken of andere vormen van ongelukkig gebruik van data worden voorkomen.
De genoemde punten kunnen ook bij gebruik van een self-service BI-tool als voordeel benoemd worden, maar in de praktijk blijkt de borging hiervan toch een heel stuk lastiger dan via een datawarehouse. Waar een datawarehouse voornamelijk beheerd wordt door IT of een centrale data-afdeling is een self-service BI-tool veelal toegankelijk voor meerdere gebruikers binnen de organisatie. Om tot eenzelfde resultaat te komen moeten afspraken gemaakt worden, specifieke rechten worden ontleend en vergt het veel discipline om dit op hetzelfde niveau te krijgen als via een datawarehouse.
Het inrichten van een datawarehouse vergt een investering, maar kan bij een goede inrichting zeker de moeite waard zijn.