Hoe optimaliseer je een softrobot?

Shutterstock learning

Het optimaliseren van softrobots om specifieke taken uit te voeren, is een groot rekenprobleem. Gelukkig komen onderzoekers van MIT met een nieuw model dat het ontwerp en de optimalisatie van de besturing van softrobots veel gemakkelijker maakt.

Zachte robots hebben verende, flexibele, rekbare lichamen die in wezen op elk moment op een oneindig aantal manieren kunnen bewegen. Rekenkundig gezien is dit een zeer complexe ‘toestandsweergave’, die beschrijft hoe elk onderdeel van de robot beweegt. Toestandsvoorstellingen voor zachte robots kunnen potentieel miljoenen dimensies hebben, waardoor het moeilijk is om de optimale manier te berekenen om een robot complexe taken te laten uitvoeren.

Onlangs presenteerden MIT-onderzoekers een model dat een compacte, of ‘laagdimensionale’, maar toch gedetailleerde toestandsweergave leert, gebaseerd op onder andere de onderliggende fysica van de robot en zijn omgeving. Het model helpt bij het iteratief optimaliseren van de besturing en het parametriseren van materiaal en ontwerp, afgestemd op specifieke taken.

“Zachte robots zijn oneindig-dimensionale wezens die op elk moment op een miljard verschillende manieren buigen”, zegt eerste auteur Andrew Spielberg, een afgestudeerde student in het Computer Science and Artificial Intelligence Laboratory (CSAIL). “Maar, in werkelijkheid zijn er natuurlijke manieren waarop zachte objecten kunnen buigen. We vinden dat de natuurlijke toestanden van zachte robots zeer compact te beschrijven zijn in een laagdimensionale beschrijving. We optimaliseren de besturing en het ontwerp van zachte robots door een goede beschrijving van de waarschijnlijke toestanden te leren.

In simulaties stelde het model 2D- en 3D-soft­robots in staat om taken - denk aan het verplaatsen over bepaalde afstanden of het bereiken van een doel - sneller en nauwkeuriger uit te voeren dan de huidige state-of-the-art methoden. De onderzoekers zijn vervolgens van plan om het model in echte softrobots te implementeren.

De studenten Allan Zhao, Tao Du en Yuanming Hu, Daniela Rus, directeur van CSAIL, Andrew en Erna Viterbi, hoogleraar Elektrotechniek en Computerwetenschappen en Wojciech Matusik, universitair hoofddocent Elektrotechniek en Computerwetenschappen bij het MIT en hoofd van de Groep Computerfabricage, werken samen met Spielberg op de krant.

‘Learning-in-the-loop’

Zachte robotica is een relatief nieuw onderzoeksgebied, maar het is veelbelovend voor geavanceerde robotica. Flexibele lichamen zouden bijvoorbeeld een veiligere interactie met mensen kunnen bieden, een betere manipulatie van objecten en meer wendbaarheid, naast andere voordelen.

MiT 1

MiT 2

Grootste uitdaging voor motion van soft robots is een hoogdimensionale toestandsruimte te correleren aan een laagdimensionale representatie.

De besturing van robots in simulaties berust op een ‘waarnemer’, een programma dat variabelen berekent die zien hoe de softrobot beweegt om een taak uit te voeren. In eerder werk hebben de onderzoekers de zachte robot ontleed in met de hand ontworpen clusters van gesimuleerde deeltjes. De deeltjes bevatten belangrijke informatie die helpen om de mogelijke bewegingen van de robot te beperken. Als een robot bijvoorbeeld op een bepaalde manier probeert te buigen, kunnen de actuatoren die beweging zo weerstaan dat ze genegeerd kunnen worden. Maar voor dergelijke complexe robots kan het handmatig kiezen van de clusters die tijdens de simulaties moeten worden gevolgd, lastig zijn.

Voortbordurend op dat werk hebben de onderzoekers een ‘learning in the loop’-optimalisatiemethode ontworpen, waarbij alle geoptimaliseerde parameters worden aangeleerd tijdens één enkele feedbackloop over vele simulaties. Tegelijk met ‘optimalisatielus’ leert de methode ook de toestandsweergave.

Voxels (3D-pixels) en compressie

Het model maakt gebruik van een techniek die een materiaalpunt methode (MPM) wordt genoemd, die het gedrag van deeltjes van continuüm materialen, zoals schuim en vloeistoffen - omringd door een achtergrondraster - simuleert. Hierbij worden de robotdeeltjes en zijn waarneembare omgeving vastgelegd in 3D-pixels, ook wel voxels genoemd, zonder dat er extra berekeningen nodig zijn.

MiT 3

De nieuwe methode leert toestanden en optimaliseert tegelijkertijd  de besturings- en ontwerp parameters.

In een leerfase wordt deze rasterinformatie van ruwe deeltjes ingevoerd in een machine-learning-component die leert de invoer te comprimeren tot een laagdimensionale weergave en om de weergave terug te decomprimeren in het invoerbeeld. Als deze ‘auto-encoder’ voldoende detail behoudt tijdens het comprimeren van het invoerbeeld, kan hij het invoerbeeld nauwkeurig nabootsen.

In het werk van de onderzoekers dienen de aangeleerde gecomprimeerde representaties van de auto-encoder als de laagdimensionale toestand van de robot. In een optimaliseringsfase wordt die gecomprimeerde representatie weer in de regelaar geplaatst, die een berekende activering uitvoert voor hoe elk deeltje van de robot moet bewegen in de volgende MPM-gesimuleerde stap.

MiT 4

De methode is gebaseerd op differentieerbare natuurkundige soft body actions in een grid.

Tegelijkertijd gebruikt de controller die informatie om de optimale stijfheid voor elk deeltje aan te passen om de gewenste beweging te bereiken. In de toekomst kan die materiaalinformatie nuttig zijn voor het 3D-printen van softrobots, waarbij elk deeltje met een iets andere stijfheid kan worden geprint. “Dit maakt het mogelijk om robotontwerpen te maken die afgestemd zijn op de bewegingen van de robot, waarbij elk deeltjescluster met een iets andere stijfheid kan worden geprint. Het robotontwerp is dus beter afgestemd op de robotbewegingen die relevant zijn voor specifieke taken”, zegt Spielberg. “Door deze parameters samen te leren, houd je alles zo veel mogelijk synchroon wat ook het ontwerpproces vergemakkelijkt.”

Snellere optimalisatie

Alle optimaliseringsinformatie wordt op zijn beurt weer teruggekoppeld naar het begin van de lus om de auto-encoder te trainen. In veel simulaties leert de controller de optimale beweging en het optimale materiaalontwerp, terwijl de auto-encoder de steeds gedetailleerdere toestandsweergave leert. “We willen dat die laagdimensionale toestand zeer beschrijvend is”, aldus Spielberg.

MiT 5

Hierdoor zijn Deep convulational networks aan grid states te koppelen.

Nadat de robot over een bepaalde periode zijn gesimuleerde eindtoestand heeft bereikt - bij voorkeur zo dicht mogelijk bij de doelbestemming - werkt hij een ‘verliesfunctie’ bij. Dat is een cruciaal onderdeel van het machine learning, dat fouten tot een minimum beperkt. In dit geval minimaliseert het hoe ver weg de robot van het einddoel is gestopt. Die verliesfunctie vloeit terug naar de besturing, die het foutsignaal gebruikt om alle geoptimaliseerde parameters af te stemmen en de taak zo goed mogelijk uit te voeren.

MiT 6

Het algoritme is op verschillende ‘stretchy’ robotontwerpen getest.

Als de onderzoekers zouden proberen om alle ruwe deeltjes van de simulatie rechtstreeks in de regelaar te voeren, dus zonder de compressiestap, zou de rekentijd die nodig is veel te hoog zijn”, besluit Spielberg. Maar met behulp van de gecomprimeerde weergave bleken de onderzoekers in staat om de looptijd van elke optimalisatie-iteratie te verkorten van enkele minuten tot ongeveer tien seconden.

De onderzoekers hebben hun model gevalideerd met het simuleren van verschillende 2D- en 3D-tweevoeters en viervoeters. De onderzoekers ontdekten ook dat, terwijl robots die gebruikmaken van traditionele methoden tot 30.000 simulaties nodig hebben, robots die getraind zijn op hun model slechts ongeveer 400 simulaties nodig hadden.

Het implementeren van het model in echte zachte robots betekent ook het aanpakken van problemen met echte ruis en onzekerheid die de efficiëntie en nauwkeurigheid van het model kunnen verminderen. Maar in de toekomst hopen de onderzoekers de volledige keten van ontwerpsimulatie tot en met de fabricage van softrobots te bestrijken. MiT 7

Deze 3D-viervoeter moet zover mogelijk naar rechts bewegen in de toegekende tijd.