We zetten in de inleiding 'nieuwste' tussen aanhalingstekens, omdat object storage eigenlijk helemaal niet zo heel nieuw is, al is het wel nieuwer dan block storage en file storage. Het bestaat al sinds het midden van de jaren '90. Toch is het pas recent echt doorgebroken. Volgens Toor is dat niet zo heel gek, want object storage heeft een bepaald gebruiksdoel, dat er in de jaren '90 simpelweg nog niet was. Het is, zoals hij het zelf zegt, ontwikkeld voor het cloudtijdperk. Zo is het via HTTPS te benaderen, iets wat bij andere opslagarchitecturen (block storage en file storage) standaard niet mogelijk is. Dit maakt het mogelijk om de opslag op afstand te adresseren, een belangrijk onderdeel van de werking van de cloud in de breedste zin van het woord.

Daarnaast is de architectuur bij uitstek geschikt voor het opslaan en terughalen van ongestructureerde data. En laat dat nu juist het type data zijn dat het hardst groeit. Denk hierbij vooral aan videobestanden, die veel ruimte in beslag nemen en waarvan er steeds meer komen. De steeds maar toenemende resolutie zorgt er ook voor dat de vraag naar opslag toeneemt.

Gemaakt voor horizontaal schalen

Een van de meest onderscheidende kenmerken van de architectuur van object storage is dat het is gemaakt voor horizontale schaalbaarheid in het datacenter. Hiermee is het mogelijk om opslag relatief eenvoudig uit te breiden zonder dat je tegen prestatielimieten aanloopt. Dat heb je bijvoorbeeld wel bij NAS en SAN, die verticaal schalen en niet gemaakt zijn om gedistribueerd te worden over meerdere locaties. In theorie kun je met object storage over meerdere locaties verspreid over de hele wereld petabytes aan opslag adresseren, zonder dat je er noemenswaardige concessies voor hoeft te doen op het gebied van prestaties.

Sterker nog, naarmate je meer schaalt bij object storage, wordt het geheel efficiënter. Dat wil zeggen, hoe meer zogeheten storage nodes je gebruikt, hoe hoger de beschikbaarheid van je data wordt. Daarnaast gaan de prestaties omhoog. Dat laatste is mogelijk doordat alle afzonderlijke nodes tegelijkertijd rechtstreeks geadresseerd worden. Dit in tegenstelling tot andere architecturen, waarbij alles via een 'master' loopt, die bij het schalen steeds zwaarder belast wordt. Dan gaan de prestaties juist achteruit.

Metadata

Schaalbaarheid van de opslag is natuurlijk een belangrijk onderdeel, maar je wilt uiteraard ook data terug kunnen vinden. Daarvoor is de metadata van belang. Op dat vlak biedt object storage behoorlijk wat flexibiliteit die je bij file en block storage niet hebt. Je kunt de metadata vrijwel naar eigen inzicht aanpassen, bijvoorbeeld om objecten (de containers waarin de data en de metadata zijn ondergebracht) alleen te koppelen aan specifieke applicaties, of om er prioritering aan te geven.

Deze flexibiliteit op het gebied van de metadata is uiteraard ook gewoon nodig, omdat je in object storage-omgevingen natuurlijk met veel meer data werkt dan bij file en block storage. Het zorgt er echter wel voor dat object storage op het gebied van indexering vele malen beter is dan de andere typen.

Toor heeft een interessante analogie om de indexering bij object storage te duiden. Andere opslagvormen kun je zien als een kaartenbak in een bibliotheek. Je moet eerst in de kaartenbak zoeken waar het boek zich bevindt in de bibliotheek en vervolgens nog maar hopen dat het boek ook daadwerkelijk daar staat waar het zou moeten staan. De indexering en dus vindbaarheid van data bij object storage kun je volgens hem beter vergelijken met Google Search, dus aan de hand van heel veel metadata. Het is veel sneller en accurater.

S3 API

Een verder onderscheidend kenmerk van object storage is dat het niet rechtstreeks te benaderen is. Dit moet via een API gebeuren, dus via een applicatie. Cloudian gebruikt hiervoor de wat Toor de de facto standaard noemt, namelijk de S3 API. Deze is ontwikkeld door en wordt ook gebruikt door AWS in de cloud, maar is dus inmiddels ook doorgedrongen in het datacenter waar object storage wordt gebruikt.

Het voordeel van het gebruiken van de S3 API, is uiteraard dat iedere applicatie ermee overweg kan, omdat S3 de eerste API is waarvoor ondersteuning ingebouwd wordt. Dat zal voor bedrijven zoals Hortonworks dan ook een behoorlijke uitdaging worden. Hadoop werkt namelijk met HDFS. Daar is op zich niets mis mee, maar volgens Toor zal dat niet de standaard worden. De kans dat een applicatie ermee overweg kan, is kleiner dan bij S3.

Cloud is niet het antwoord op alles...

Cloudian richt zich op de (on-prem) datacenterwereld en gaat partnerships aan met partijen zoals Lenovo, maar ook Rubrik en Veeam. Er zit volgens Toor nog heel veel rek in de markt die ze kunnen bereiken. Hij schat deze in op 40-50 miljard. Dat verklaart dan ook waarom er bij de meest recente investeringsronde relatief zoveel geld is opgehaald door het bedrijf. Het haalde in de E-ronde (traditiegetrouw de laatste voor de beursgang) met 94 miljoen dollar meer op dan in de vier rondes ervoor samen. Dat geeft aan dat investeerders het steeds meer zien zitten met het bedrijf, maar in een breder perspectief ook met object storage.

Deels zal dit volgens Toor een gevolg zijn van het inzicht dat de cloud niet het antwoord is op alles. Soms worden data sneller gegenereerd dan ze verstuurd kunnen worden bijvoorbeeld. Dan zit er niets anders op dan deze lokaal op te slaan, anders lopen processen vertraging op of raak je data kwijt.

Cloudian wil tegenwoordig verder ook nog duidelijk maken dat object storage een uitstekend alternatief is voor tape, waar in veel datacenters voor gekozen wordt bij het archiveren van data. Niet dat object storage goedkoper is, geeft Toor meteen toe, maar het is natuurlijk wel veel beter geïndexeerd. Dat kan zeker met het oog op allerlei privacyverplichtingen van bedrijven tegenwoordig een belangrijke overweging zijn. Daarnaast is bij grote archieven de schaalbaarheid uiteraard een voordeel.

...maar (on-prem) object storage ook niet

Het is overigens niet zo dat object storage voor alle mogelijke vormen van opslag de beste keuze is. Toor houdt het erop dat Cloudian zich richt op 80 procent van de opslagbehoefte, de overige 20 procent is niet hun markt.

In de basis kun je stellen dat object storage erg geschikt is voor tamelijk statische opslag van vooral veel data. Deze data wordt vaak gelezen, maar er wordt niet veel meer mee gedaan op het gebied van schrijven. Dat wil zeggen, de bestanden worden niet meer veel gewijzigd. Voorbeelden hiervan zijn zoals al aangehaald foto's, video's en archieven.

Ga je echter aan de slag met zaken zoals transactionele/relationele databases of andere zaken waarvoor veel random read/write acties uitgevoerd moeten worden, dan is object storage niet de beste oplossing. Dan kun je beter voor block storage gaan, zoals je dat wellicht kent uit de NAS/SAN-wereld. Daarnaast zal er volgens Toor altijd nog lokaal razendsnelle opslag nodig zijn. Denk hierbij aan de producten van Pure Storage of Nutanix bijvoorbeeld.

Een bepaald type klant

Uiteindelijk is dus niet iedereen een klant voor Cloudian. Toor merkt ook nog op dat het doorgaans de bedrijven zijn die ook op andere vlakken wat nieuwere leveranciers kiezen, die Cloudian interessant vinden. Zo zullen bedrijven die Rubrik hebben voor back-up en disaster recovery bijvoorbeeld eerder voor Cloudian kiezen dan bedrijven die met Veeam werken. Al was het maar omdat Rubrik de S3 API ondersteunt, wat ook de basis is voor Cloudian.

Uiteindelijk is Toor ervan overtuigd dat ieder (groot) bedrijf op termijn tegen een muur gaat aanlopen als het gaat om opslag. Een sector zoals Media & Entertainment (productiehuizen en dergelijke) loopt traditiegetrouw voor op het gebied van nieuwe opslagtechnologieën. De overstap naar 4K is uiteraard een belangrijke factor geweest bij het kijken naar nieuwe manieren om de data op te slaan. Maar ook in de gezondheidszorg gaat de resolutie van bijvoorbeeld MRI's steeds verder omhoog.

Sprong voorwaarts

We vragen tot slot van ons gesprek hoe we object storage nu moeten zien in het grotere geheel. Hoe groot is de stap van NAS/SAN naar object storage nu eigenlijk, als je het moet vergelijken met een andere technologische vooruitgang in de IT? Volgens Toor is object storage ten opzichte van NAS/SAN wat pc's in het netwerk waren ten opzichte van het mainframe.

Nog los van enige overdrijving die ongetwijfeld onderdeel is van deze analogie, is het wel duidelijk dat we hier te maken hebben met een significante ontwikkeling binnen de opslagwereld. De vergelijking maakt ook meteen duidelijk wat Toor als het meest onderscheidende ziet van object storage: de mogelijkheden binnen het moderne, gedistribueerde model, waarbij data overal verspreid opgeslagen kan zijn.

Net zoals je voorheen niet meer naar het mainframe moest lopen om gebruik te maken van de computer, maar het gewoon aan je bureau op je pc kon afhandelen, maakt het bij object storage niet meer uit waar je data staan. Zeker als je op meerdere plaatsen verspreid grote hoeveelheden ongestructureerde data hebt staan, is dat eerder een sprong dan een stap voorwaarts.