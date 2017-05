Toen Google zijn Tensor Processing Unit (TPU) onthulde, was de strategie meteen al duidelijk: machine learning schaalbaar maken door snelle hardware tegen het probleem aan te smijten. Gebruik gangbare GPU's om machine learning-modellen te trainen en gebruik TPU's om de nieuwe modellen uit te rollen.

End-to-end machine learning

De nieuwe generatie TPU's is ontworpen om die beide taken te verrichten, trainen en inzetten, maar dan met dezelfde chip. De nieuwe reeks is daarnaast sneller, zowel op zichzelf als geschaald met andere processoren in wat Google een 'TPU pod' noemt.

Snellere machine learning is niet het enige voordeel van dit ontwerp. De TPU, vooral in zijn nieuwste vorm, is een onderdeel van Google's end-to-end machine learning-pipeline, dat alles omvat van de invoer van data tot het inzetten van het getrainde model.

Simpele applicatie

Een van de grotere uitdagingen van machine learning op dit moment is hoe lastig het is om een volledige data-pipeline te hebben: invoer, normalisatie, modeltraining, model en uitrol. Er zijn veel verschillende stukken die slecht te coördineren zijn. Bedrijven als Baidu hebben al gehint naar de wens om een enkele, uniforme oplossing te maken, maar tot nu toe is het slechts bij hints en ideeën gebleven.

Een voor de hand liggende plek voor de komst van zo'n oplossing is de cloud. Veel van de data die wordt verzameld voor machine learning (en alle andere data trouwens) staat daar al. Dat geldt ook voor de hardware die we nodig hebben om resultaten waar je wat mee kunt doen te genereren. Geef mensen een enkele end-to-end cloudworkflow voor machine learning, eentje met standaard slechts enkele bedieningselementen, en ze zullen er met plezier bovenop bouwen.

Opschalen

Google's visie om elke fase in de cloud uit te kunnen voeren, zo dicht mogelijk bij de oorspronkelijke data en op de best mogelijke snelheid, is bijna voltooid. Met TPU's wil Google ook veel van die fases mogelijk maken met aangepaste hardware-acceleratie die naar behoefte kan worden opgeschaald.

