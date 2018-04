Door deep learning en machine learning, snellere processoren en nieuwe typen sensoren, kunnen computers nu zien, horen, voelen, ruiken en spreken. Deze zintuigen combineren een sensor (bijvoorbeeld een camera) en een wiskundig algoritme, meestal supervised machine learning en een model dat getraind wordt.

In dit artikel kijken we naar verschillende machinale zintuiglijke waarnemingen en wat er op dat gebied momenteel gebeurt.

Zien: Beeld- en gezichtsherkenning

Recent onderzoek op het gebied van beeld- en gezichtsherkenning zorgt ervoor dat computers niet alleen detecteren dat een object aanwezig is, maar herkennen meerdere instances van soortgelijke objecten. Facebook en Google lopen hiermee voorop, met meerdere open source-releases. Facebooks doel is om objecten in filmpjes te herkennen.

Op dit vlak is veel vooruitgang geboekt de afgelopen jaren. Objecten kunnen nu los herkend worden van de achtergrond en als instance worden verwerkt. Maar dat je iets hebt gevonden en het kunt scheiden van andere objecten, betekent natuurlijk nog niet dat je weet wat het is. Daarvoor moet een model worden getraind met veel verschillende objecten.

Daarvoor zijn krachtige tools, maar deze hebben erg veel gegevens nodig. Facebook en Google geven ze daarom uit, behalen hun voordeel met het onderzoek dat ontwikkelaars uitvoeren en maken zich niet te druk over concurrentie. Weinig organisaties hebben miljoenen of miljarden afbeeldingen, laat staan de enorme rekenkracht die nog is om ze te verwerken.

In feite komt het erop neer dat het classificeren van objecten voor deze doeleinden als eerste een zaak is van het 'zien' van verschillende instances van bijvoorbeeld een kat om diens verschillende verschijningsvormen te labelen: grote, kleine, harige, dunne, dikke, staartloze, et cetera. Daarna kun je een model trainen om de verschillende iteraties van het object te herkennen.

Facebook en Google zetten hier duidelijk het zwaarst op in, maar er zijn meer tools, zoals de library OpenCV, die allerlei functionaliteiten mogelijk maakt, en OpenFace, wat zich enkel richt op gezichtsherkenning. Verder heb je Jevois (Frans voor "ik zie"), een slimme camera voor Arduino-apparaten die is getraind op modellen van open source-library's. Je plan om een zelfvliegende quadcopter te bouwen met Arduino en zulke library's is dus inderdaad uitvoerbaar.