Roboter BRETT. (Foto: UC Berkeley Robot Learning Lab / Bildschirmaufnahme YouTube)
Berkeley – Forscher an der University of California, Berkeley haben Algorithmen entwickelt, mit denen Roboter ähnlich wie Menschen lernen können. Eine Maschine ist damit in der Lage, ganz ohne spezielle Programmierung nur durch Versuch und Irrtum ganz unterschiedliche Tätigkeiten zu erlernen. Der aktuelle Beispielroboter «BRETT» hat sich so zwar nur relativ einfache mechanische Tätigkeiten wie das Stapeln von Lego-Steinen angeeignet. Die Wissenschaftler sind aber überzeugt, dass in den kommenden Jahren Roboter mit dieser Methode auch deutlich komplexere Aufgaben erlernen können.
Roboter für eine bestimmte Aufgabe in einer kontrollierten Umgebung zu programmieren, ist relativ einfach. «Die Herausforderung beim Einsatz von Roboter in alltäglichen Umfeldern wie Eigenheimen oder Büros ist, dass sich dort die Umwelt ständig verändert», so der Informatiker Trevor Darrell. Idealerweise sollten die Maschinen lernfähig genug sein, um sich ohne neue Programmierung auf veränderte Situationen einzustellen – ähnlich wie ein Mensch. Das Berkeley-Team setzt dazu auf «tiefes Lernen», das sich das Gehirn zum Vorbild nimmt. Mit nur einem Algorithmus kann ein Roboter so durch Versuch und Irrtum lernen, wie unterschiedliche Aufgaben zu lösen sind.
Heranpunkten ans Ziel
Die Forscher haben ihren Ansatz mithilfe des Roboters BRETT (Berkeley Robot for the Elimination of Tedious Tasks) getestet. Dieser musste unterschiedliche Aufgaben bewältigen, darunter das Zuschrauben einer Thermoskanne ebenso wie das Benutzen eines Schuhstreckers und das Stapeln von Lego-Steinen. Der Lernalgorithmus nutzt dabei eine Funktion, die BRETT durch einen Punktewert anzeigt, wie zielführend eine versuchte Handlung war. Desto höher der Wert, desto näher ist der Roboter dem Ziel. Das erlaubt ihm, sich schrittweise an die richtige Lösung für eine Aufgabe heranzutasten.
Damit das funktioniert, muss der Roboter die Umgebung sowie seine Hände und Arme mittels Kamera-Auge sehen. Der Algorithmus liefert ihm dann dank der Punktefunktion laufend Echtzeit-Feedback. So lernt der Roboter sinnvolle Werte für 92.000 Parameter, mit denen er eine Aufgabe letztlich richtig bewältigen kann. Wenn BRETT die Ausgangslage und die richtige Lösung kennt, dauert der Lernprozess etwa zehn Minuten. Muss er zusätzlich erst begreifen, wo sich notwendige Gegenstände befinden, braucht der Roboter zum Lernen ungefähr drei Stunden.
Grosser Schritt, weiter Weg
Die Handgriffe, die BRETT erlernt hat, sind noch relativ einfach – fast wie bei einem Kind, das lernt, indem es mit Bauklötzen spielt. Doch die Demonstration, dass der Lernalgorithmus funktioniert, ist laut Berkeley-Forschern ein wichtiger Schritt für die KI-Forschung. «Entscheidend ist, dass wir einen Roboter nicht umprogrammieren müssen, wenn er vor einem neuen Problem steht», betont Informatikprofessor Pieter Abbeel. Denn ein und dieselbe Software reiche für alle Lernprozesse.
Da Computer immer leistungsfähiger werden und mehr Daten verarbeiten können, rechnet Abbeel für die kommenden Jahre mit grossen Fortschritten. «Mit mehr Daten kann man komplexere Dinge lernen», erklärt er. Bis Roboter so weit sind, ganz allein das richtige Sortieren der Schmutzwäsche zu erlernen, wird es sicher noch dauern. Doch die Ergebnisse der Experimente mit BRETT stimmen den Informatiker optimistisch. «Innerhalb von fünf bis zehn Jahren könnten wir dank dieser Art der Forschung grosse Fortschritte bei der Lernfähigkeit von Robotern erleben.» (pte/mc/ps)