SPEAR-1: Otwarty model AI uczy roboty myśleć w 3D

Europejscy naukowcy pokazali SPEAR‑1, model AI open-source dla robotów. Dzięki danym 3D maszyny zyskują nową zręczność, co może zrewolucjonizować przemysł.

W skrócie:

Bułgarski instytut INSAIT opublikował SPEAR‑1, otwarty model AI dla robotów przemysłowych. Ma on przyspieszyć innowacje w dziedzinie zrobotyzowanej automatyzacji na całym świecie.
Model jako jeden z pierwszych integruje dane 3D, co daje mu lepsze rozumienie przestrzeni i fizyki obiektów. Dzięki temu roboty precyzyjniej wykonują skomplikowane zadania.
W testach wydajności, takich jak benchmark RoboArena, SPEAR‑1 dorównuje komercyjnym modelom od startupów wycenianych na miliardy dolarów, jak Physical Intelligence.

W świecie sztucznej inteligencji modele open source stały się paliwem dla innowacji, które napędzają całą branżę. Pozwoliły tysiącom deweloperów i firm eksperymentować, tworzyć i rzucać wyzwanie gigantom z Doliny Krzemowej. Teraz podobna rewolucja może czekać robotykę. Europejscy badacze z Institute for Computer Science, Artificial Intelligence and Technology (INSAIT) w Bułgarii właśnie wypuścili SPEAR‑1 – potężny, otwarty model AI, który działa jak mózg dla robotów przemysłowych. Jego zadanie? Nauczyć maszyny chwytać i manipulować przedmiotami z niespotykaną dotąd zręcznością.

Dlaczego robot potrzebuje mózgu, który myśli w 3D?

Dotychczasowe modele fundamentalne dla robotów bazowały głównie na wizyjno-językowych fundamentach (VLM). Uczyły się świata z gigantycznej bazy oznaczonych, ale płaskich, dwuwymiarowych obrazów. To trochę jak próbować zrozumieć zasady działania silnika, patrząc tylko na jego schemat na kartce papieru. Działa, ale do pewnego stopnia. Taki robot ma ograniczone pojęcie o fizycznym świecie. SPEAR‑1 zmienia zasady gry, bo do swojej mieszanki treningowej włącza dane trójwymiarowe. To daje mu znacznie głębsze, niemal intuicyjne rozumienie tego, jak obiekty poruszają się w przestrzeni.

Martin Vechev, naukowiec z INSAIT i ETH Zurich, ujął to prosto w rozmowie z magazynem WIRED: “Nasze podejście rozwiązuje problem niedopasowania między przestrzenią 3D, w której operuje robot, a wiedzą VLM, który stanowi rdzeń modelu fundamentalnego dla robotyki”. Innymi słowy, SPEAR‑1 myśli w tej samej rzeczywistości, w której działa, a nie w jej uproszczonej, 2D reprezentacji. To przekłada się na konkretne umiejętności – od wyciskania keczupu z butelki, przez zamykanie szuflady, po zszywanie kartek papieru. Właśnie takie zadania testuje benchmark RoboArena, na którym bułgarski model wypada równie dobrze co komercyjne odpowiedniki.

Open source, czyli Llama dla świata maszyn?

W wyścigu o stworzenie inteligentnych robotów biorą udział firmy warte miliardy dolarów. Startup Physical Intelligence, założony przez gwiazdy świata robotyki, dysponuje potężnym kapitałem i rozwija własne, zamknięte modele. A jednak SPEAR‑1, projekt akademicki, jest niemal tak samo skuteczny jak ich komercyjny model Pi‑0.5. To pokazuje siłę otwartego oprogramowania. Vechev nie ma wątpliwości, że przyszłość zależy od takich właśnie projektów. “Modele o otwartych wagach są kluczowe dla postępu w dziedzinie ucieleśnionej AI” – stwierdził. Upublicznienie SPEAR‑1 ma na celu dokładnie to samo, co premiera modeli Llama od Mety w świecie LLM – dać narzędzia mniejszym graczom, badaczom i startupom, by mogli szybciej eksperymentować i iterować swoje pomysły.

To kluczowy moment. Jeśli społeczność naukowa i biznesowa podchwyci projekt, możemy być świadkami eksplozji innowacji. Zamiast czekać, aż wielkie korporacje (jak OpenAI, Google czy Anthropic) udostępnią swoje rozwiązania – często w ograniczonej formie i za wysoką cenę – deweloperzy na całym świecie będą mogli budować na otwartym fundamencie. To demokratyzacja dostępu do technologii, która może całkowicie zmienić układ sił na rynku robotyki przemysłowej i nie tylko.

Czy to już początek ery generalnie inteligentnych robotów?

Spokojnie, inteligencja robotów wciąż jest w powijakach. Obecnie potrafimy wytrenować ramię robota, by niezawodnie podnosiło konkretny przedmiot ze stołu. Problem pojawia się, gdy zmienimy ramię, przedmiot albo otoczenie. Wtedy cały model trzeba trenować od nowa. To gigantyczna bariera, która hamuje powszechne wdrożenie robotów w mniej przewidywalnych warunkach niż linia produkcyjna w fabryce. Marzeniem badaczy jest stworzenie modelu na tyle ogólnego, by robot potrafił błyskawicznie adaptować się do nowych zadań i sytuacji. Modele takie jak SPEAR‑1 są krokiem w tym kierunku.

Docelowo takie systemy mogłyby pozwolić robotom humanoidalnym na pracę w chaotycznym, nieznanym środowisku – na przykład na placu budowy albo w domu – dzięki ogólnemu zrozumieniu, jak działa świat. Karl Pertsch z Physical Intelligence, choć sceptyczny co do tego, jak ważna okaże się ostatecznie rola danych 3D, przyznaje, że postęp jest imponujący. “To naprawdę fajne widzieć, jak grupy akademickie budują ogólne strategie, które można ocenić w zróżnicowanych środowiskach i które osiągają nietrywialną wydajność” – komentuje. A potem dodaje coś, co najlepiej podsumowuje tempo zmian: “To nie było możliwe jeszcze rok temu”.

Rewolucja w fabrykach? Ujawniono SPEAR‑1, darmową AI, która uczy roboty myśleć w 3D

Dlaczego robot potrzebuje mózgu, który myśli w 3D?

Open source, czyli Llama dla świata maszyn?

Czy to już początek ery generalnie inteligentnych robotów?

Aleksandra Wilk

Warto przeczytać też:

Ford rzuca wyzwanie Tesli. Nowy asystent AI i jazda bez trzymanki już w 2028

Klęska za 1,5 biliona dolarów. W mieście przyszłości zamieszkają serwery, nie ludzie.

ChatGPT za 1000 zł miesięcznie? To nie żart. Nowa oferta OpenAI dla profesjonalistów

Koniec z duszeniem procesorów! AI popłynie radiem prosto do twojego drona

Eksperci ujawniają mroczny sekret AI. To koniec mitu o ‘czystej’ technologii

Figma stawia na Gemini. Google wchodzi do świata designu, ale to nie jest umowa na wyłączność