Artificiële Intelligentie - Creatieve Technologie
In het voorgaande artikel hebben we kunnen lezen dat het oplossen van problemen centraal staat bij intelligentie en dat een programma via Machine Learning zichzelf kan optimaliseren dit te doen. Machine Learning zorgt ervoor dat een programma informatie op nieuwe manieren kan waarnemen en interpreteren, om zo uiteindelijk te kunnen leren van de data die het te verwerken krijgt.
In dit artikel gaan we via het programma AlphaGo zien hoe het de technologie is, die hier zelf creatief wordt, in plaats van de mens die de technologie gebruikt. Technologie gaat uiteindelijk problemen oplossen waar wij dat niet meer kunnen, op manieren die wij niet altijd volledig begrijpen. Dit soort nieuwe technologie gaat hierdoor denk ik steeds minder op een gereedschap lijken en steeds meer op een nieuw soort entiteit met een eigen handelingsvermogen.
Menselijk
Het spelen van 'Go' wordt in China al 2500 jaar gedaan, waardoor dit het oudste bordspel ter wereld is dat al deze tijd nog gespeeld wordt. In het oude China werd het zelfs als één van de vier kunsten gezien die een werkelijk nobel en beleerd mens zou beheersen naast kalligrafie, het bespelen van het 'Guqin' instrument en schilderen. De ambtenaren van de keizer moesten deze kunsten beheersen om tot de zogenoemde 'Literati' klasse te behoren. Het was voor hedendaagse Go spelers dan ook moeilijk voor te stellen dat een computerprogramma deze kunst ooit echt zou kunnen meesteren. Het bordspel Go draagt in al zijn uiterlijke eenvoud van ronde steentjes namelijk een ongekende diepgang en complexiteit van binnen. Het heeft vele malen meer mogelijke zetten dan schaak door het grotere speelveld, waarbij elk steentje gelijk is en overal waar ruimte is geplaatst zou kunnen worden. Go zou zelfs een groter aantal bordposities hebben (geschat op 2 × 10170), dan dat er atomen in het zichtbare Universum zijn (geschat op 1080).
Het grote bord van Go met die veel ruimere bewegingsvrijheid, dwingt de speler om op gevoel te werken. Er zijn namelijk zoveel variabelen om rekening mee te houden dat men niet alles letterlijk vooruit kan zien of berekenen. Topspelers lijken hierbij meer te werken op hun intuïtie, die sterk is geworden door het spel al vanaf de kindertijd te spelen. Deze intuïtie lijkt gevormd te worden door een grote hoeveelheid ervaring, waardoor de spelers ter plekke oplossingen voor zich zien, die niet het resultaat zijn van alleen maar vooruit denken en berekenen. Het is alsof de speler op een onbewuste manier de structuren van het spel gaat herkennen. Dankzij onze intuïtie kunnen wij mensen op creatieve wijze Go spelen, om zo tegenstanders steeds te verassen en situaties onverwachts om te draaien, dit waar een conventioneel programma vastloopt op al die variabelen van veranderende situaties. De vorige keer zagen we namelijk dat er in slechts vier zetten Go, al 320 miljard mogelijke posities aanwezig zijn.
In de AlphaGo documentaire horen we scheidsrechter en Europees Kampioen, Fan Hui, dan ook op bijzondere wijze spreken over het spel. Fan Hui legt uit dat de Go speler een kunstenaar is die alles geeft voor zijn spel en dat het spelen van Go een werkelijk creatieve daad is. Met al deze geschiedenis, complexiteit, creativiteit en zelfs nobelheid die het spel bevat en de speler worden toegedicht, zien we denk ik niet alleen dat Go een kunstvorm is en de speler een kunstenaar. We zien denk ik ook hoe het spelen van Go voorheen altijd iets is geweest dat als typisch 'menselijk' werd beschouwd. Creativiteit, kunstzinnigheid en intuïtie zijn nu eenmaal dingen die we niet snel associëren met het gedrag van een computerprogramma. Het leek in die zin wel een spel uitsluitend voor mensen.
Onmenselijk
Toch was het in 2016 zover. Toen werd namelijk Lee Sedol, Go speler van het hoogste niveau, verslagen met 4-1 door AlphaGo. Lee Sedol behoorde ook tot de groep mensen die zich moeilijk voor konden stellen dat een programma dit spel nu al gemeesterd had. Voordat hij de match aanging sprak hij nog: "I believe that human intuition is still too advanced for AI to have caught up." Toch lijkt dit wel het geval te zijn. AlphaGo rekent namelijk niet slechts zetten vooruit, zoals we de vorige keer hebben kunnen zien. Het is ook niet een menselijke waardering van zetten die hier leidend is. AlphaGo maakt eigen keuzes op basis van alle ervaringen die het programma heeft opgedaan. Deze ervaring is enerzijds opgemaakt uit data van wedstrijden, waardoor AlphaGo een basisbegrip krijgt van hoe het spel gespeeld dient te worden. Anderzijds heeft AlphaGo daarna een heleboel wedstrijden met zichzelf gespeeld. Het heeft intern, honderd duizenden wedstrijden tegen zichzelf gespeeld om zo het algoritme te kunnen optimaliseren.
Dit optimaliseren is een proces dat doet denken aan evolutie. Een evolutie waarbij het algoritme allerlei varianten van zichzelf uitprobeert met verschillende eigenschappen en strategieën. Waarbij het steeds versies tegen elkaar opheft, met elkaar combineert en opnieuw uitvindt om zo het sterkste eindresultaat over te houden. Hier komt uiteindelijk iets uit dat we de intuïtie van het programma kunnen noemen. Het is namelijk niet alleen een berekening die ter plekken steeds gedaan wordt, het is ook een soort gecondenseerd "begrip" dat aanwezig is door al die voorgaande ervaringen.
Een fascinerende overeenkomst met het menselijk brein, is dat AlphaGo ook gebruik maakt van een neuraal netwerk dat al deze ervaringen en data als het ware 'absorbeert' en inzet om complexe verbanden mee te maken. Het is achteraf niet duidelijk hoe AlphaGo aan oplossingen komt, net zoals bij onze intuïtie, maar het lijken wel de juiste oplossingen te zijn. Deze neurale netwerken van een Deep Learning systeem worden daarom ook wel 'Black Boxes' genoemd: het zijn complexe processen waardoor een algoritme uiteindelijk zelf kan gaan waarnemen en leren. Het geleerde is echter niet meer te herleiden in goed te volgen stappen, zelfs niet voor de makers die dit algoritme in eerste instantie hebben opgezet. Bekijk voor meer informatie over neurale netwerken het voorgaande artikel.
Creatief vermogen
Nu is het interessante aan de wedstrijden die AlphaGo heeft mogen zien, dat dit geen wedstrijden zijn van topniveau. Op geen enkel moment heeft AlphaGo wedstrijden bekeken die gespeeld werden door professionele spelers. Toch is uit dit hele proces een computerprogramma gekomen dat wel op dit niveau kan spelen en zelfs een speler van het hoogste niveau, zoals Lee Sedol, met gemak kan verslaan. Hierin ligt dan ook het bewijs dat er echt iets nieuws geleerd wordt en dat AlphaGo zelfs op creatieve wijze het spel speelt. Het is namelijk op deze ongekende hoogte gekomen door zelf, met behulp van een intern neuraal netwerk, op geheel eigen wijze data te analyseren. Dit gebeurt zonder dat een speler van professioneel niveau iets uitlegt aan het programma. AlphaGo doet zelfs dingen, zo zien we in de matches tegen Lee Sedol, die mensen niet zouden doen en zelfs niet eerder gezien hebben. Hierbij ontdekt AlphaGo dus nieuwe strategieën voor een eeuwenoud bordspel, die bijdragen aan onze kennis van hoe het spel gespeeld kan worden. Een voorbeeld hiervan is 'Move 37' waarbij AlphaGo een 'Shoulder hit' doet op de 5e lijn. Dit werd voorheen altijd gezien als een fout, omdat deze normaal gesproken alleen verstandig leken te zijn op lijn 3 of 4. Er is van te voren geen ingevoerde data geweest die AlphaGo heeft laten zien dat zoiets mogelijk is op lijn 5. Toch heeft het zelf ondervonden dat deze strategie kan werken, en heeft het deze mogelijkheden doorontwikkeld. Tegenwoordig hebben Go spelers deze Move 37 in hun arsenaal opgenomen en probeert men te leren van de situaties die AlphaGo hierdoor laat ontstaan.
Hiermee zien we dus een programma dat zelf aan het denken is. Het kan een probleem op eigen en creatieve wijze oplossen. Hierdoor is er naar mijn idee werkelijk sprake van intelligentie. Niet alleen dat, we zien met AlphaGo ook hoe de mens wordt verslagen op zijn eigen terrein. Een terrein van al die bovenstaande eigenschappen zoals creativiteit, stijl, klasse en intuïtie. Daarnaast heeft AlphaGo dit leerproces vele malen sneller doorlopen dan wij mensen dit ooit zouden kunnen.
Opvolgers
Het wordt nog indrukwekkender zodra we de ontwikkelingen bekijken die plaatsvinden na de wedstrijd van 2016. Om te beginnen hebben we 'AlphaGo Master', een verbeterde versie die heeft kunnen leren van de match met Lee Sedol. AlphaGo Master heeft het in 2017 opgenomen tegen wereldkampioen Ke Jie, een Chinese speler die op dat moment nummer 1 van de wereld was. AlphaGo Master won in China met 3-0 tegen Ke Jie. Na deze match had Ke Jie een aantal bijzondere uitspraken over het programma. In dit clipje vertelt hij over zijn onmacht tegen het programma. Hij spreekt over een vergelijking waarbij de mens slechts de vijver voor zich ziet waarin hij kan vissen, en het programma het gehele universum eromheen kan zien. Hij zegt vervolgens dat hij genoegen zal moeten nemen met de vijver, waar AlphaGo het gehele universum voor ons kan gaan verkennen. AlphaGo Master heeft in totaal nog zestig wedstrijden gespeeld tegen professionele spelers van het hoogste niveau, waarbij het alles heeft gewonnen en dus geen enkele keer verslagen is.
Daar blijft het echter niet bij. Het ontwikkelteam van AlphaGo kwam in 2017 namelijk ook met een totaal nieuwe versie genaamd 'AlphaGo Zero'. Het interessante aan AlphaGo Zero is dat dit programma een nieuw algoritme heeft waar helemaal geen data van menselijke spelers doorheen is gegaan. Het programma heeft alleen met behulp van Machine Learning en Deep Learning technieken, matches tegen zichzelf gespeeld. Het algoritme heeft dus geheel zonder ingegeven wedstrijden of andere menselijke data, vanaf het begin alles zelf moeten leren en uitproberen om succesvol te worden in Go. Het wonderlijke is dat dit nieuwe programma zichzelf in slechts drie dagen ontwikkelde tot een versie die superieur is aan de versie waar Lee Sedol van verloor. Het kon deze namelijk na 3 dagen aan eigen interne "evolutie", verslaan met 100 - 0. Na slechts 21 dagen aan ontwikkeling streefde AlphaGo Zero ook de verbeterde versie, AlphaGo Master, voorbij. Uiteindelijk kon het na 40 dagen ook elke andere AlphaGo versie met gemak verslaan en versloeg het zo ook AlphaGo Master in honderd matches met 89 - 11.
General Intelligence
Alsof dit alles niet genoeg is, komt nu nog de meest fascinerende versie tot op heden. Alpha Zero. Het interessante aan Alpha Zero is, zoals we in de naam al kunnen zien, dat het element 'Go' is weggehaald. Alpha Zero is een zelflerend algoritme dat net als zijn voorganger, AlphaGo Zero, geen menselijke wedstrijden heeft gezien. Daarbij komt ook nog dat het Alpha Zero algoritme, zo adaptief is, dat het niet gemaakt is als een specialist voor Go. Het kan hierdoor ook ingezet worden bij andere bordspellen. Dit komt doordat het een neuraal netwerk heeft dat zichzelf constant vernieuwd. Het was voor de onderzoekers dan ook verbijsterend om te zien, dat Alpha Zero binnen 24 uur een bovenmenselijke staat van spelen bereikte in maar liefst drie verschillende bordspellen: Alpha Zero is in staat om AI's van het hoogste niveau te verslaan in zowel Go als Schaak en in het Japanse spel Shogi. Met Alpha Zero wordt gestreefd naar een algemenere AI, die zelf een eigen begrip krijgt van meer taken dan alleen Go. Dit begint dus ook al meer en meer te lijken op die toekomstige 'Artificial General Intelligence' (AGI), die we hebben kunnen zien in het eerste deel uit deze reeks.
De programma's van vandaag de dag kunnen dus al een eigen ontwikkeling doormaken, zelf iets leren en op creatieve wijze problemen oplossen, zonder dat hier menselijke data en kennis van zaken voor nodig is. Dit gegeven van problemen oplossen zonder menselijke input, is noodzakelijk als we willen dat het problemen oplost die wij niet goed begrijpen. We willen namelijk dat een toekomstige AI een situatie vanaf het begin opnieuw kan bekijken, zonder dat hier menselijke aannames of beperkingen tussendoor lopen. Hier ligt een kans om een AI te maken die zo fundamenteel anders denkt en waarneemt dan wij mensen, dat het ook met radicaal andere methoden en oplossingen kan komen. Daarom is de ontwikkeling die we bij Alpha Zero zien ook zo belangrijk. Daar wordt namelijk al een algoritme gecreëerd dat losgelaten kan worden in verschillende omgevingen of op diverse problemen. Het gaat zelf aan de slag om op geheel eigen wijze oplossingen te vinden, zonder dat wij steeds interventies moeten plegen en de stof zelf moeten begrijpen. Hier zien we de AI langzaam loskomen van onze beperkte opzet, ons denken en de door ons veronderstelde realiteit. Dit zal grotendeels ook moeten om er echt iets aan te hebben bij grote toekomstige problemen. Dit is echter ook waar het gevaar schuilt naar mijn idee. Een gevaar dat we zullen bespreken in een volgend stuk.
Reacties
log in of registreer om een reactie te geven