De verwachtingen van eindgebruikers zijn groter dan ooit nu data overal bij je is met de cloud. Er worden hogere eisen gesteld aan beschikbaarheid, terwijl tegelijkertijd het geduld van klanten is afgenomen. In het verleden kon het gerust tien uur duren om content te downloaden, maar dat is zeker geen scenario meer waar gebruikers rekening mee houden. De eisen qua prestaties zijn hoog, maar er zijn ook zorgen over waar je data staat en wat ermee gebeurt. Internet is soms een vreemde plaats met asymmetrische patronen, buffer-bloat en andere prestatiegerelateerde issues.

Ook groeit internet stevig door. De verwachting is dat we volgend jaar qua netwerkverkeer zijn gestegen naar 1,5 gigabyte aan data per dag per persoon. Dat getal stijgt nog fors verder met de verwachtte explosie aan IoT-verkeer. Een internetverbonden vliegtuig, bijvoorbeeld, is goed voor 5 terabyte aan data per dag. De exponentiële groei aan dataverkeer zorgt ervoor dat we anders na gaan denken over gegevensbeheer en applicatie-delivery.

Want dit kan niet allemaal meer worden verwerkt door een enkele cloud of een on-prem serverpark. Latency blijft een probleem. In virtual reality zorgt alles boven de zeven miliseconde voor bewegingsziekte, tegenwoordig ook wel eens simulatorziekte of cybersickness genoemd. En wanneer beslissingen realtime genomen dienen te worden, kan data niet op en neer naar de cloud. Maar je kunt wel gebruik maken van Edge-computing en multi-CDN ontwerp.

Edge en multi-CDN

De adoptiegraad van cloud, videostreaming, IoT en Edge blazen allemaal nieuw leven in CDN- en multi-CDN-concepten. Dat laatste is, zoals de naam al doet vermoeden, een infrastructuurontwerp waarbij je meerdere CDN-providers gebruikt. De toewijzing van verkeer gaat op basis van verschillende informatie en statistieken, waarbij load-balancing op verkeer wordt toegepast of je een fail-over hebt naar verschillende leveranciers.

Edge-computing zorgt ervoor dat acties zo dicht mogelijk bij de bron worden verwerkt. Je kunt het zien als het punt waar de fysieke wereld het dichtst op de digitale schurkt. Logischerwijs zal de gedecentraliseerde aanpak het gecentraliseerde model niet vervangen, maar werken ze als aanvulling op elkaar. De applicatie kan daardoor op piekniveau werken, afhankelijk van waar hij zich bevindt in het netwerk.

In IoT is het bijvoorbeeld van cruciaal belang om zoveel mogelijk de accuduur te beperken. Laten we ervan uitgaan dat een IoT-apparaat een transactie in 10 ms Round Trip Time (RTT) kan doen in plaats van 100 ms RRT, zoals vaker het geval is. Dat betekent dat je tien keer vaker transacties kan uitvoeren voor dezelfde energie, of dat je tien keer zoveel accukracht kunt besparen.

Internet is een bottleneck

Internet is ontworpen met het idee dat iedereen met iedereen moet kunnen praten, dus met universele connectiviteit als streven. Er is een aantal moderne ontwerpwijzigingen geweest, met misschien Network Address Translation als de grootste. Maar de grootste rol van internet is hetzelfde gebleven qua connectiviteit ongeacht je locatie.

Met zo'n connectiviteitsmodel is afstand een belangrijke factor voor de prestaties van een applicatie. Gebruikers aan de andere kant van de wereld hebben problemen ongeacht buffergroottes of andere optimalisaties: je kunt een langere RTT tegemoet zien als packets heen en weer schuiven over de verbinding. Met caching en het aanpassen van verkeerspaden los je het een en ander op, maar dat succes heeft zijn beperkingen.

Dynamisch inspelen op netwerkomstandigheden

Als TCP start, denkt het protocol dat het eind jaren 70 is: het gaat ervan uit dat alle diensten op dezelfde LAN draaien en er geen packet-loss is. Toen het werd ontworpen, hadden we nog geen realtime verkeer zoals spraak en video, wat gevoelig is voor latency en jitter. TCP was gemaakt voor gebruiksgemak en betrouwbaarheid, niet voor hoge prestaties.

De TCP-stack moet dus worden verbeterd en dit is de reden dat CDN's zo goed zijn in deze taken. Als bijvoorbeeld een signaal van een smartphone komt, gaat een CDN er bij voorbaat vanuit dat er veel jitter en packet-loss zal zijn. TCP wordt daarop door de CDN aangepast om in te spelen op de daadwerkelijke netwerkomstandigheden.

Wat zijn je opties om de prestaties te verhogen? De meeste mensen kijken in algemene zin naar het verlagen van de latency, maar met toepassingen, zoals videostreaming, geeft latency je niet zo'n goede indicatie of de video gaat bufferen. Je kunt alleen maar aannemen dat lagere latency leidt tot minder buffering. Meten op throughput is echter een veel betere indicator, omdat je daaraan kunt aflezen hoe snel een object wordt geladen.

Onze meetinstrumenten

Je moet ook nadenken over laadtijden van pagina's (page load). Op netwerkniveau gaat het om Time To First Byte (TTFB) en ping. Maar deze mechanismes zeggen niet zoveel over de UX omdat alles in één packet gaat. Met ping leer je niet genoeg over bandbreedteproblemen. Als een webpagina 25 procent langzamer gaat bij een verlies van meer dan 5 procent van de packets en je meet TTFB bij het vierde packet, wat weet je dan eigenlijk? TTFB kun je vergelijken met een ICMP-request in een hogere laag van de netwerkstack: het is prima om te zien of iets niet werkt, maar je weet niet of er een subtieler prestatie-issue is.

Als je kijkt naar hoe TTFB is ingezet, merk je dat het werd gebruikt vanwege een gebrek aan metingen die Real User Monitoring (RUM) verrichten. In het verleden was TTFB goed genoeg om te schatten hoe snel iets geladen gaat worden, maar we hoeven niet meer te schatten omdat we nu kunnen meten met RUM. Dat meet bij de eindgebruiker, denk aan statistieken van een webpagina zoals die wordt afgeleverd bij de bezoeker.

Noodzaak voor multi-CDN

TTFB, ping en page load zijn geen geavanceerde meetmethodes. We zouden RUM zoveel mogelijk meten gebruiken, omdat we daarmee een nauwkeuriger beeld krijgen van de UX en dat is van cruciaal belang geworden de afgelopen tien jaar. We leven nu in een wereld waarin RUM ons in staat stelt om netwerken zo in te richten dat we kijken naar wat van belang is voor de zakelijke use-case. CDN's moeten allemaal mikken op RUM-metingen. Om dat te bereiken, moeten we wellicht integreren met netwerkverkeerssystemen die intelligent meten wat een eindgebruiker daadwerkelijk ervaart.

De hoofdredenen om een multi-CDN-omgeving te kiezen zijn beschikbaarheid en performance. Er is geen losse CDN die voor iedere situatie en overal ter wereld het snelst kan zijn. Dat is niet mogelijk vanwege het connectiviteitsmodel van het internet. Maar door de beste twee of meer CDN-leveranciers te combineren, kun je prestaties verbeteren. Met meerdere CDN's kun je betere performance en beschikbaarheid bereiken dan met een enkele CDN. Een goed ontwerp richt zich op meerdere zones van beschikbaarheid, een beter ontwerp richt zicht op zones in combinatie met een CDN en een superieur ontwerp gebruikt meerdere zones in een multi-CDN-ontwerp.

Wat een Edge-applicatie in feite is

Niet zo lang geleden lieten we fysieke monolithische on-prem architecturen meer los en bewogen we naar cloud. Maar wat we eigenlijk deden, was het verplaatsen van de fysieke appliance naar een cloud-gebaseerde virtuele appliance. Misschien is de tijd rijp om ons de vraag te stellen: is dat eigenlijk wel wenselijk? Die mindset is lastig, want het is een behoorlijke uitdaging om anderen (en jezelf) duidelijk te maken dat die infrastructuur waar je zoveel tijd, geld en moeite in hebt gestoken misschien niet de beste manier is om de bedrijfsvoering te verbeteren.

De cloud heeft dan wel veel aandacht gegenereerd, maar het simpelweg migreren naar cloud betekent niet dat je applicaties soepeler draaien. Sterker nog, je hebt alleen maar de fysieke stukken van je architectuur gevirtualiseerd en je betaalt iemand anders om het te beheren. Het voordeel is dat deze evolutie ons naar Edge-applicaties heeft geleid. De cloud was de eerste stap en het is tijd om de vervolgstap te zetten.

Als je denkt aan Edge-applicatie, moet je eigenlijk in de simpelste vorm denken aan een programmeerbare CDN. Een CDN is een Edge-applicatie en een Edge-applicatie is een superset van wat een CDN eigenlijk doet: ze gaan om cloud-computing in de Edge. Het is een concept waarbij je de latency van applicaties verlaagt door ze dichter bij de databron te plaatsen. Het zorgt niet alleen voor lagere latency, maar ook voor een versimpelde infrastructuur met meer beheer, privacy en meer resilience dan bij een gecentraliseerde applicaties. De infrastructuur wordt een architectuur die goedkoper, eenvoudiger en meer gericht is op applicatieprestaties. Dat betekent dat het netwerk meer kijkt naar wat eigenlijk belangrijk is voor een bedrijf: de klant.

Voorbeeld van een architectuur

Een voorbeeld van een architectuur is dat binnen elke PoP de applicaties hun eigen geïsoleerde JavaScript-omgeving hebben. Dat is een dedicated geïsoleerde instance die code aan de Edge uitvoert. Logischerwijs heeft iedere instance zijn eigen virtuele machine. Die VM voert alleen de JS-runtime uit met enkel de code van de klant. Je zou daarvoor Google's V8 of de WebAssembly-engine kunnen gebruiken.

­Laten we eerlijk wezen: hoe meer PoP's we bouwen, hoe minder meerwaarde in het netwerk we ervoor terugkrijgen. Als je applicaties voor mobiel bouwt, zijn meer PoP's niet de oplossing, dus we moeten op zoek naar iets anders. We gaan een trend zien dat de meeste applicaties wereldwijd worden ingezet en dat leidt onherroepelijk tot Edge-applicaties. Het is immers niet logisch om alles vanuit één locatie te draaien als je gebruikers zich overal ter wereld bevinden.