05-12-2019 11:39 am Gepubliceerd door Nederland.ai Laat uw gedicht achter

Model registreert “verrassing” wanneer objecten in een scène iets onverwachts doen, dat kan worden gebruikt om slimmere AI te bouwen.

Rob Matheson | MIT News Office
2 december 2019

Mensen hebben een vroeg begrip van de wetten van de fysieke realiteit. Baby’s hebben bijvoorbeeld verwachtingen over hoe objecten moeten bewegen en met elkaar moeten communiceren, en zullen verrast zijn als ze iets onverwachts doen, zoals verdwijnen in een handige goocheltruc.

Nu hebben MIT-onderzoekers een model ontworpen dat een goed begrip van enkele elementaire ‘intuïtieve fysica’ laat zien over hoe objecten zich zouden moeten gedragen. Het model kan worden gebruikt om slimmere kunstmatige intelligentie op te bouwen en op zijn beurt informatie te verstrekken om wetenschappers te helpen de babykennis te begrijpen.

Het model, ADEPT genaamd, observeert objecten die rond een scène bewegen en maakt voorspellingen over hoe de objecten zich zouden moeten gedragen, op basis van hun onderliggende fysica. Tijdens het volgen van de objecten voert het model een signaal uit op elk videoframe dat overeenkomt met een niveau van “verrassing” – hoe groter het signaal, hoe groter de verrassing. Als een object ooit dramatisch niet overeenkomt met de voorspellingen van het model – bijvoorbeeld door te verdwijnen of te teleporteren over een scène – zullen de verrassingsniveaus stijgen.

Als reactie op video’s die objecten tonen die zich fysiek aannemelijk en ongeloofwaardig bewegen, registreerde het model verrassingsniveaus die overeenkwamen met niveaus gerapporteerd door mensen die dezelfde video’s hadden bekeken.

“Tegen de tijd dat baby’s 3 maanden oud zijn, hebben ze het idee dat objecten niet in en uit het bestaan knipogen en niet door elkaar kunnen bewegen of teleporteren”, zegt eerste auteur Kevin A. Smith, een onderzoekswetenschapper in de Afdeling Hersenen en Cognitieve Wetenschappen (BCS) en een lid van het Centre for Brains, Minds and Machines (CBMM). “We wilden die kennis vastleggen en formaliseren om babykennis in kunstmatige intelligentie-agenten te bouwen. We komen nu bijna in de buurt van mensen zoals de manier waarop modellen elementaire onwaarschijnlijke of plausibele scènes kunnen onderscheiden. ”

Samen met Smith op het papier zijn co-eerste auteurs Lingjie Mei, een student aan de Afdeling Elektrotechniek en Computerwetenschappen, en BCS onderzoekswetenschapper Shunyu Yao; Jiajun Wu PhD ’19; CBMM-onderzoeker Elizabeth Spelke; Joshua B. Tenenbaum, een professor in computationele cognitieve wetenschappen en onderzoeker in CBMM, BCS, en het Computer Science and Artificial Intelligence Laboratory (CSAIL); en CBMM-onderzoeker Tomer D. Ullman PhD ’15.

Verkeerde realiteiten

ADEPT vertrouwt op twee modules: een “omgekeerde grafische” module die objectrepresentaties van onbewerkte afbeeldingen vastlegt, en een “physics engine” die de toekomstige representaties van de objecten voorspelt uit een verdeling van mogelijkheden.

Inverse graphics haalt in principe informatie van objecten – zoals vorm, pose en snelheid – uit pixelinvoer. Deze module legt videoframes vast als afbeeldingen en gebruikt omgekeerde grafische afbeeldingen om deze informatie uit objecten in de scène te extraheren. Maar het loopt niet vast in de details. ADEPT vereist slechts enkele benaderde geometrie van elke vorm om te functioneren. Gedeeltelijk helpt dit het model voorspellingen over nieuwe objecten te generaliseren, niet alleen die waarop het is getraind.

“Het maakt niet uit of een object een rechthoek of cirkel is, of dat het een vrachtwagen of een eend is. ADEPT ziet gewoon dat er een object met een bepaalde positie is dat op een bepaalde manier beweegt om voorspellingen te doen, ‘zegt Smith. “Evenzo lijken jonge baby’s ook niet veel te geven om sommige eigenschappen, zoals vorm, bij het maken van fysieke voorspellingen.”

Deze grove objectbeschrijvingen worden ingevoerd in een fysica-engine – software die het gedrag van fysieke systemen simuleert, zoals stijve of vloeibare lichamen, en wordt vaak gebruikt voor films, videogames en computergraphics. De fysica-engine van de onderzoekers “duwt de objecten op tijd vooruit”, zegt Ullman. Dit creëert een reeks voorspellingen of een ‘geloofsverdeling’ voor wat er met die objecten in het volgende frame zal gebeuren.

Vervolgens observeert het model het eigenlijke volgende frame. Nogmaals, het vangt de objectrepresentaties op, die het vervolgens uitlijnt met een van de voorspelde objectrepresentaties uit zijn geloofsverdeling. Als het object de natuurwetten gehoorzaamde, zal er niet veel mismatch zijn tussen de twee representaties. Aan de andere kant, als het object iets ongeloofwaardigs heeft gedaan – laten we zeggen dat het van achter een muur is verdwenen – zal er een grote mismatch zijn.

ADEPT neemt vervolgens opnieuw monsters uit zijn geloofsverdeling en merkt een zeer lage waarschijnlijkheid dat het object eenvoudig was verdwenen. Als de kans klein genoeg is, registreert het model een grote ‘verrassing’ als een signaalpiek. Kortom, verrassing is omgekeerd evenredig met de waarschijnlijkheid dat zich een gebeurtenis voordoet. Als de kans erg laag is, is de signaalpiek erg hoog.

“Als een object achter een muur gaat, blijft je fysica ervan overtuigd dat het object zich nog steeds achter de muur bevindt. Als de muur naar beneden gaat en er niets is, is er een mismatch, ‘zegt Ullman. “Dan zegt het model: ‘Er staat een object in mijn voorspelling, maar ik zie niets. De enige verklaring is dat het verdwenen is, dus dat is verrassend. ‘”

Schending van verwachtingen

In de ontwikkelingspsychologie voeren onderzoekers tests voor ‘schending van verwachtingen’ uit waarbij zuigelingen paren video’s worden getoond. Eén video toont een plausibele gebeurtenis, waarbij objecten zich houden aan hun verwachte opvattingen over hoe de wereld werkt. De andere video is in alle opzichten hetzelfde, behalve dat objecten zich gedragen op een manier die de verwachtingen op een of andere manier schendt. Onderzoekers zullen deze tests vaak gebruiken om te meten hoe lang het kind naar een scène kijkt nadat een ongeloofwaardige actie heeft plaatsgevonden. Hoe langer ze staren, veronderstellen onderzoekers, hoe meer ze verrast of geïnteresseerd kunnen zijn in wat er net is gebeurd.

Voor hun experimenten creëerden de onderzoekers verschillende scenario’s op basis van klassiek ontwikkelingsonderzoek om de kernkennis van het model te onderzoeken. Ze hadden 60 volwassenen in dienst om 64 video’s te bekijken van bekende fysiek plausibele en fysiek ongeloofwaardige scenario’s. Voorwerpen, bijvoorbeeld, zullen achter een muur bewegen en wanneer de muur valt, zullen ze er nog steeds zijn of ze zullen verdwenen zijn. De deelnemers beoordeelden hun verrassing op verschillende momenten op een toenemende schaal van 0 tot 100. Vervolgens toonden de onderzoekers dezelfde video’s aan het model. In het bijzonder onderzochten de scenario’s het vermogen van het model om noties van duurzaamheid vast te leggen (objecten verschijnen of verdwijnen niet voor niets), continuïteit (objecten bewegen langs verbonden trajecten) en stevigheid (objecten kunnen niet door elkaar bewegen).

ADEPT paste mensen bijzonder goed bij video’s waar objecten achter muren bewogen en verdwenen toen de muur werd verwijderd. Interessant is dat het model ook overeenkwam met verrassingsniveaus op video’s waar mensen niet door werden verrast, maar misschien hadden moeten zijn. In een video waarin bijvoorbeeld een object dat met een bepaalde snelheid beweegt, achter een muur verdwijnt en onmiddellijk aan de andere kant naar buiten komt, is het object mogelijk dramatisch versneld toen het achter de muur ging of het kon naar de andere kant worden geteleporteerd. Over het algemeen waren mensen en ADEPT minder zeker over de vraag of die gebeurtenis wel of niet verrassend was. De onderzoekers ontdekten ook dat traditionele neurale netwerken die fysica leren van observaties – maar niet expliciet objecten vertegenwoordigen – veel minder nauwkeurig zijn in het onderscheiden van verrassende van niet-verrassende scènes, en hun keuzes voor verrassende scènes komen niet vaak overeen met mensen.

Vervolgens zijn de onderzoekers van plan om verder in te gaan op hoe baby’s de wereld observeren en leren, met als doel nieuwe bevindingen in hun model op te nemen. Studies tonen bijvoorbeeld aan dat baby’s tot een bepaalde leeftijd eigenlijk niet erg verrast zijn wanneer objecten op sommige manieren volledig veranderen – bijvoorbeeld als een vrachtwagen achter een muur verdwijnt, maar weer opduikt als een eend.

“We willen zien wat er nog meer moet worden ingebouwd om de wereld meer als baby’s te begrijpen, en formaliseren wat we weten over psychologie om betere AI-agenten te bouwen,” zegt Smith.

Bron: http://news.mit.edu/2019/adept-ai-machines-laws-physics-1202

Tags : , , , , ,

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

zeventien + twee =

The maximum upload file size: 256 MB. You can upload: image, audio, video, document, spreadsheet, interactive, text, archive, code, other. Links to YouTube, Facebook, Twitter and other services inserted in the comment text will be automatically embedded. Drop file here