Datawarehousing is het onderbrengen van allerlei soorten data in één systeem, zodat het beter mogelijk is te analyseren en rapporteren over allerlei aanwezige kennis binnen de organisatie. Op basis daarvan kunnen betere beslissingen worden genomen.
Datawarehousing is te vergelijken met het op één hoop gooien van de kaartenbak met klanten, het kasboek en het voorraadbeheer in het magazijn waardoor een bedrijf de boel beter kan evalueren. Of, iets technischer gezegd: 'Datawarehousing is een onderwerpgeörienteerde, geïntegreerde, tijdsafhankelijke gegevensverzameling met als doel het maken van management informatie.' Die definitie is van computerwetenschapper Bill Inmon, veelal beschouwd als een van de grondleggers van datawarehousing met zijn boek 'Building the Data Warehouse', dat in 1991 verscheen.
Verwantschap met BI
Zeker in de vorige eeuw werd datawarehousing beschouwd als een Siamese tweeling van Business Intelligence (BI): de een zou niet zonder de ander kunnen. En nog steeds is het bouwen van een datawarehouse vaak noodzakelijk, voorafgaand aan het invoeren van BI. Maar een datawarehouse kan ook op zichzelf staan. Want hoe dan ook zal het integreren van informatie beter gaan en zal de complexiteit in de data verminderen, zodat evaluatie en rapportage beter en eenvoudiger wordt.
Tot een goed functionerend datawarehouse komen is niet altijd even gemakkelijk. Zowel in het ontwerp, de architectuur, de projectuitvoering als de exploitatie van een datawarehouse lopen bedrijven risico's. IT'ers, directie, finance en andere afdelingen hebben elk hun eigen belangen en doelen, waardoor zelfs het vaststellen van exacte personele kosten tot ellenlange discussies kan leiden. Het zijn echter wel noodzakelijke discussies, want anders blijven er meerdere definities naast elkaar bestaan, met invoering van verschillende data, op verschillende manieren, met verschillende (waarschijnlijk onjuiste) uitkomsten.
Samenwerking van IT en business is dus ook bij dit tamelijk technisch ogend onderwerp zowel noodzaak als struikelblok. Zoals zo vaak. En daar komt nog eens bij dat datawarehousing zelfs bij kleine vragen al om heldere afspraken schreeuwt: spreken we over 'M/V' of 'Man/Vrouw'? Kortom: een datawarehouse vraagt om een ijzersterk ontwerp en een goede, slimme architectuur.
Hoe ga je te werk?
Door alle informatie top-down in kaart te brengen, kom je tot een helder beeld van alle informatie. Maar juist om zo'n omvangrijk ontwerp te voorkomen - want dan is de eerste stap al een nachtmerrie - pleiten velen ervoor om met kleinere datamarts te beginnen. Een fraaie 'bottom-up' benadering die ook zijn eigen fanatieke aanhang heeft. Al lijken er goede vooruitzichten te zijn voor een meer integrale benadering waarbij de voordelen van beide benaderingen worden benut.
Op de markt van datawarehousing komen al snel de bekende namen voorbij: Oracle, IBM en ook Microsoft. Het sterk gespecialiceerde Teradata heeft echter een aardige voorsprong op deze IT-giganten. Het is een markt waarin het niet langer draait om wie het grootste datawarehouse kan leveren, maar de beste oplossing op maat. Waarbij datawarehouses door grote organisaties als onmisbaar worden beschouwd en steeds meer bedrijven kiezen voor een vorm van datawarehousing - al was het maar om enigszins grip te houden op de nog altijd sterk groeiende stroom van informatie en andere data (big data) in bedrijven.
Reageer
Preview