Naukowcy nauczyli robota podnoszenia różnych przedmiotów. Dlaczego to takie ważne?
Roboty podbijają świat, ale wciąż jest jeszcze bardzo dużo do zrobienia w tej dziedzinie. Szczególnie w zakresie uczenia się maszyn interakcji z różnymi obiektami, ale specjaliście z MIT właśnie dokonali przełomu.
Niezawodni inżynierowie z MIT opracowali nową metodę wizualnego uczenia się przedmiotów. W tym przypadku mówimy konkretnie o robocie w formie ramienia, które poznaje odmienne typy butów, przyglądając się im pod przeróżnymi kątami. Dzięki temu rozwiązaniu, po tym, jak przed robotem postawi się nieznany mu typ buta i poprosi się o jego podniesienie za język, maszyna jest w stanie zidentyfikować ten fragment i chwycić za niego bez asysty człowieka, która normalnie byłaby wymagana w tym scenariuszu. Wydawać może się to dość trywialnym osiągnięciem, ale tak naprawdę to istotny kamień milowy w świecie robotów, które mają duże problemy z odnalezieniem się w skomplikowanym świecie ludzi.
Przeważnie trenując robota zmuszeni jesteśmy do prowadzenia go za rękę, co w tym przypadku oznacza wykorzystanie dżojstika do nauczenia maszyny manipulowania obiektami, co nazywane jest nauką imitacji (technika imitation learning). Można też próbować metody uczenia przez wzmacnianie (reinforcement learning), w której pozwalamy robotowi na próbowanie do skutku, np. dopasowanie kwadratowego klocka do otworu w tym kształcie. W tym przypadku maszyna wykonuje dość losowe ruchy i nagradzana jest w momencie, kiedy zbliża się do celu (podobna zasada jak uczenie zwierząt), ale zabiera to naprawdę dużo czasu. Pozostaje jeszcze swoista symulacja, ale wiedza, jaką zyskuje wirtualny robot, nie przekłada się łatwo na rzeczywiste maszyny.
Dlatego też nowy system jest przełomowy i unikalny, ponieważ niemal nie wymaga naszej pomocy. Wkład naukowców ograniczał się tu niemal jedynie do postawienia butów przed robotem. Owoce tej pracy możecie zobaczyć na poniższym obrazku GIF.
Model ten porównać można do układu współrzędnych lub też kolekcji adresów przypisanych do butów. Robot gromadzi informacji na temat struktury butów i w momencie ukończenia treningu jest w stanie odczytać z kontekstu, w jaki sposób zabrać się za model, z którym nie miał wcześniej do czynienia.
„Jeśli wskażemy na język buta na innym obrazie, wtedy robot praktycznie przygląda się nowemu obiektowi i stara się ustalić, który z punktów wygląda najbardziej podobnie do języka w innych butach, które już poznał. Na tej podstawie jest w stanie go zidentyfikować” - tłumaczy Pete Florence z MIT.
Robot za każdym razem robi zdjęcia butów pod różnym kątem, zbierając w ten sposób informacje na temat ich budowy i tworząc własną bazę danych na temat znaczenia poszczególnych pikseli na fotografiach. Porównując poszczególnie fotki, określa czym są sznurówki, język czy podeszwa i wykorzystuje te dane do treningu.
Oczywiście metoda ta wykorzystywana może być z różnymi obiektami, a nie tylko butami i stanowi kolejny ważny krok w kierunku samouczenia się i budowania świadomości robotów na temat otaczającego ich świata, zamiast pisania kodu, który odnosiłby się do każdego możliwego przedmiotu, z jakim maszyna może wejść w interakcje. Wygląda na to, że robotyka w najbliższej przyszłości będzie jedną z najszybciej rozwijających się dziedzin nauki i czeka ją naprawdę świetlana przyszłość.
Źródło: GeekWeek.pl/Wired