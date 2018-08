Als één bedrijf een goede reden had om Oracle te dumpen, dan was het Amazon wel. Maar toch, 14 jaar nadat Amazon begon met klagen over zijn "belastende Oracle database infrastructuur" en startte met het "evalueren of we een speciaal gebouwde database kunnen ontwikkelen die onze zakelijke behoeften op de lange termijn zal ondersteunen" is de internetwinkel en cloudprovider nog zeker tot het eerste kwartaal van 2020 niet vrij van Oracle, zoals dat wordt beschreven door CNBC's Jordan Novet.

Die "I can't leave you, baby"-realiteit, om de tekst van Led Zeppelin aan te halen, is niet zozeer een bewijs van Oracle's database-grootsheid, maar van de moeilijkheden die inherent zijn aan het verplaatsen van gegevens. Of, zoals Gartner-analist Merv Adrian ooit zei: "De grootste kracht van legacy-databases is inertie."

Waarom zelfs het machtige Amazon vastzit op zijn legacy Oracle databases

Waarschijnlijk heeft Amazon de database van Oracle al in 2004 verder opgeschaald dan die aankon, zoals Amazon CTO Werner Vogels toen al zei, maar pas tien jaar later overwoog Amazon serieus om de eerbiedwaardige technologie te vervangen. Zoals uit de interviews van Novet blijkt:

"Amazon begon ongeveer vier of vijf jaar geleden met verhuizen weg van Oracle, zei een van de mensen, die verzocht niet bij naam te worden genoemd omdat het project vertrouwelijk is. Sommige delen van Amazon's core shopping business draaien nog steeds op Oracle, zei deze persoon, en pas over 14 tot 20 maanden moet de volledige migratie zijn afgerond. Een andere persoon vertelde dat Amazon al jaren overwoog om Oracle uit te faseren voordat de migratie begon. Maar ze besloten op dat moment dat het veel te veel ingenieurswerk zou kosten en te weinig zou opleveren."

"Te veel werk met misschien te weinig rendement" beschrijft perfect waarom de meeste legacy tech blijft hangen. Als een applicatie eenmaal geschreven is om op het mainframe te draaien, heeft het vaak weinig zin om deze te herschrijven zodat hij elders kan draaien. In de woorden van Adrian: "Als iemand heeft geïnvesteerd in het ontwerp, de fysieke plaatsing van gegevens, de netwerkarchitectuur, enzovoort rond een bepaalde tool, dan doek je dat niet zomaar op en verplaats je die data niet zomaar even."

Wat niet kapot is, hoeft niet te worden gerepareerd. Tenminste, dat wordt niet gedaan.

En dus zat Amazon vast aan Oracle, zelfs met de legacydatabase die niet zo kan schalen zodat hij aan de behoeften van Amazon kan voldoen. In plaats van alles opnieuw ontwerpen, heeft Amazon simpelweg nieuwe toepassingen gebouwd die draaien op hun eigen databasetechnologieën zoals DynamoDB en Aurora.

Ondertussen, meesmuilde Oraclebaas Larry Ellison op een bijeenkomst in december 2017 dat Amazon $50 miljoen moest ophoesten, bovenop honderden miljoenen die ze in de loop van de afgelopen jaren al hadden betaald. Maar zulk leedvermaak kan het totale falen van Oracle niet verdoezelen om te concurreren met Amazon Web Services in de cloud, waar haar marktaandeel niet meer is dan een afrondingsfout. En dat zou niet zo erg zijn als het niet voor het voldongen feit stond dat data in toenemende mate in de cloud ontstaan, en dat het daar dus blijft in cloud-databases, zoals die van AWS of Microsoft Azure.

Waarschijnlijk gebruik je je RDBMS niet zoals hij bedoeld is

Bedrijven die hun huidige toepassingen eens goed onder de loep leggen, zouden wel eens kunnen ontdekken dat, net zoals Amazon in 2005 deed, "ze vaak niet werden gebruikt voor hun relationele functies". Graaf je nóg dieper, dan kun je erachter komen, net als Amazon, dat "about 70 percent of operations were of the key-value kind, where only a primary key was used and a single row would be returned. About 20 percent would return a set of rows, but still operate on only a single table."

Met andere woorden: bedrijven die goed kijken naar hun data komen erachter dat Oracle (of willekeurig welke relationele database ze ook gebruiken) helemaal niet geschikt is voor wat ze ermee doen.

Het strijdtoneel voor data is het mogelijk maken van transformatie

Maar het is helemaal niet denkbeeldig dat bedrijven, net als Amazon, er 14 jaar over gaan doen om hun RDBMS uit te faseren voor die oude workloads, omdat "er te veel werk mee is gemoeid en het misschien te weinig oplevert." Voor nieuwe toepassingen staat er daarentegen voldoende rendement tegenover.

Data ontstaat niet alleen in toenemende mate in de cloud, ook is het aantal manieren waarop je ze kunt beheren aanzienlijk toegenomen. Dit betekent niet dat relationele databases zoals Oracle dood zijn. Het betekent alleen dat één enkele applicatie vaak verschillende databases zal gebruiken. Zoals Vogels schreef:

"We zien steeds meer dat klanten toepassingen willen bouwen die schalen over het internet, en daarvoor zijn diverse datamodellen nodig. Om aan deze behoeften te voldoen, hebben ontwikkelaars nu de keuze uit relationele, key-value, document, graph, in-memory en search databases. Elk van deze databases lost een specifiek probleem of een groep problemen op."

Dit is echter een op de toekomst gerichte verklaring. Het gaat om wat bedrijven bouwen of gaan bouwen, in plaats van wat ze al hebben gebouwd (en waar ze mee moeten leren leven).

Dit is het strijdtoneel van data. Het gaat niet om legacy-applicaties en de legacy-databases die deze ondersteunen. Nee, het gaat om de toekomst van het bedrijf, want bedrijven proberen een verbluffende hoeveelheid gegevens aan het werk te zetten om hun manier van werken te veranderen.

Dit is een wereld waar Oracle - als marktleider - tot nu toe heel weinig impact heeft. Als dit zo doorgaat, zal niet alleen Amazon zich uiteindelijk ontworstelen aan de greep van Oracle op zijn data-infrastructuur, maar ook de meeste andere bedrijven.