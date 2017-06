Elke IT'er weet dat een programma dat zijn instructies correct interpreteert niet hetzelfde is als een programma dat zijn instructies interpreteert zoals we het eigenlijk bedoelen. Trek datzelfde programmeerconcept door naar kunstmatige intelligentie en je ziet meteen de horrorscenario's voor je. In de bieb vind je kasten vol met boeken over machines die het beste met de mens voor moeten hebben en daarmee een dystopische toekomst inluiden.

Mens niks te zeggen

Misschien dat we rampen vermijden als machines een beetje meer op mensen lijken, beargumenteert een aantal Berkeley-wetenschappers met onder AI-onderzoeker Dylan Hadfield-Menell, dat de uitkomsten van een interessant experiment met een aan/uit-knop presenteert (PDF).

Puur rationele beslissingen leiden tot 'eigenwijs' gedrag dat niet altijd het gewenste gedrag is. Voeg een snufje twijfel toe aan rationele beslissingen en je krijgt minder bruuske machines. Nog beter, een machine staat toe dat ze beslissingen overlaat aan de mens, zelfs als dat betekent dat ze wordt uitgeschakeld:

Sommigen beargumenteren dat er geen reden is voor AI om zich te verzetten tegen uitschakeling, tenzij ze daarvoor expliciet is geprogrammeerd met een incentive voor zelfbehoud. [Een andere wetenschapper] wijst erop dat zelfbehoud een instrumenteel doel is van een robot, met andere woorden een subdoel dat essentieel is voor het bereiken van het originele doel. Dus zelfs als een machine geen mening heeft over leven en dood, zou ze dood vermijden als dat betekent dat het doel wordt bereikt.

Snoep of brood

In het experiment dat vorig jaar is bedacht en beschreven is door Hadfield-Menell voert een machine een taak uit en heeft ze de optie om een uitknop die een menselijke admin gebruikt uit te schakelen. De eerste machine ziet haar rationele beslissingen als superieur aan die van de mens, omdat ze veel vertrouwen heeft in haar beoordelingsvermogen. Deze machine kiest ervoor om de uitknop te deactiveren, zodat de mens niks meer over haar te zeggen heeft.

Neem die zelfverzekerdheid weg en de robot in het vervolgexperiment laat de uitknop ingeschakeld, zodat een mens kan ingrijpen. Je moet niet te ver gaan met de introductie van onzekerheid, zeggen de onderzoekers, zodat een machine haar taak niet meer juist verricht.

Denk bijvoorbeeld aan een boterhamsmerende oppasrobot die een drammend kind snoep laat eten in plaats van boterhammen, omdat de kunstmatige intelligentie, gevuld met twijfel en onzekerheid, dat toch maar toestaat. Dan heb je dus te veel twijfel toegevoegd.

Hierna: Op zoek naar de middenweg - twijfel én zelfverzekerdheid? En zijn we daar wel beter mee af?