Szef ElevenLabs, Mati Staniszewski, ogłasza: za kilka lat modele AI będą zwykłym towarem. Wyjaśnia, dlaczego teraz to wciąż największa przewaga konkurencyjna.
W skrócie:
- Mati Staniszewski z ElevenLabs przewiduje, że w perspektywie kilku lat modele AI ulegną komodytyzacji, a różnice między nimi staną się minimalne.
- Obecnie firma skupia się na budowie własnych modeli, ponieważ dają one największą przewagę jakościową, szczególnie w dziedzinie generowania realistycznego głosu.
- Przyszłość AI to modele multimodalne, łączące audio, wideo i tekst. ElevenLabs planuje partnerstwa, by łączyć swoją ekspertyzę z innymi technologiami.
Mati Staniszewski, współzałożyciel i CEO ElevenLabs, wszedł na scenę podczas konferencji TechCrunch Disrupt 2025 i powiedział coś, co w Dolinie Krzemowej mogłoby uchodzić za herezję. Stwierdził, że modele AI – sam rdzeń technologicznej rewolucji, o który biją się dziś giganci – z czasem staną się zwykłym, powszechnie dostępnym towarem. Komponentem, a nie całym produktem. To odważna teza, zwłaszcza z ust szefa firmy, która właśnie na budowie tych modeli oparła swój oszałamiający sukces. Czy to zapowiedź końca wyścigu zbrojeń w AI? A może wręcz przeciwnie – dopiero jego prawdziwego początku?
Dlaczego budować coś, co straci na wartości?
Pytanie nasuwa się samo. Skoro Staniszewski wierzy w komodytyzację, dlaczego jego firma z taką determinacją inwestuje w rozwój własnych, zamkniętych technologii? Odpowiedź jest tyleż prosta, co brutalnie pragmatyczna. Bo na razie to jedyna droga. “W krótkiej perspektywie to wciąż największa przewaga i największa zmiana jakościowa, jaką można dziś uzyskać” – wyjaśnił podczas panelu. Innymi słowy, pociąg z napisem “jakość” jeszcze nie dojechał na stację końcową. Problemy z naturalnością głosu, intonacją czy wiarygodnością interakcji wciąż istnieją. A jeśli chcesz je rozwiązać tu i teraz, nie masz wyjścia. Musisz zakasać rękawy i zbudować model samemu.
Ta strategia to gra na czas. Staniszewski przyznaje, że za rok lub dwa konkurenci nadrobią zaległości. Inne firmy również “złamią” architektoniczne wyzwania, które jego zespołowi udało się pokonać. Ale ten rok lub dwa to w świecie AI cała epoka. To okno, w którym można zbudować markę, zdobyć rynek i stworzyć ekosystem, który przetrwa erozję wartości samej technologii. “Z czasem pojawią się inni gracze, którzy również to rozwiążą” – przyznał bez ogródek. Pomimo tego ElevenLabs nie zamierza czekać. Działa, póki ma przewagę.
Koniec ery specjalizacji? Nadchodzi fuzja zmysłów
Długoterminowa wizja wykracza jednak daleko poza generowanie samego dźwięku. Staniszewski jest przekonany, że przyszłość należy do modeli multimodalnych, czyli takich, które w jednym procesie łączą różne zmysły i formaty. To już nie będzie osobne generowanie audio i wideo. Będzie to jeden, zintegrowany akt twórczy. “Będziesz tworzyć audio i wideo w tym samym czasie, albo audio i LLM w ramach jednej rozmowy” – tłumaczył, wskazując na model Veo 3 od Google jako przykład tego, co można osiągnąć przez takie połączenie.
Dla ElevenLabs oznacza to otwarcie się na współpracę. Firma aktywnie szuka partnerów i przygląda się technologiom open source. Chce łączyć swoją unikalną ekspertyzę w dziedzinie audio z tym, co najlepsi na rynku robią w obszarze obrazu czy tekstu. To logiczny krok w stronę budowania bardziej kompletnych i użytecznych narzędzi. Zamiast być tylko najlepszym na świecie “głosem”, ElevenLabs chce stać się częścią kompletnego, inteligentnego systemu do komunikacji. To już nie tylko technologia, to strategia produktowa.
Jak Apple, tylko z AI. Magia produktu i modelu
Na koniec Staniszewski użył porównania, które doskonale obrazuje jego filozofię. “Tak jak połączenie oprogramowania i sprzętu było magią dla Apple, tak wierzymy, że produkt i sztuczna inteligencja będą magią dla najlepszych zastosowań nowej generacji”. To sedno jego planu na przetrwanie w świecie, gdzie same modele AI staną się tanie i dostępne jak nafta. Wartość nie będzie leżeć w samym algorytmie, ale w tym, jak zostanie on zintegrowany z produktem końcowym. W doświadczeniu użytkownika, w niezawodności, w ekosystemie, który powstanie wokół narzędzia.
To ważna lekcja dla całej branży. Wiele firm skupia się dziś wyłącznie na budowie coraz potężniejszych modeli, zakładając, że to one zagwarantują im dominację. Staniszewski zdaje się mówić: to tylko fundament. Prawdziwa walka rozegra się na poziomie aplikacji i tego, jak technologia rozwiąże realne problemy ludzi – od prawników, przez menedżerów, po artystów. A w tej grze posiadanie najlepszego młotka nie gwarantuje, że zbuduje się najlepszy dom. Trzeba mieć jeszcze projekt.