Warty 10 mld dolarów startup AI Mercor tonie po gigantycznym wycieku danych. Hakerzy twierdzą, że mają 4TB informacji, a Meta już zawiesza współpracę. Co dalej?
W skrócie:
- Hakerzy twierdzą, że po ataku na startup Mercor weszli w posiadanie 4 terabajtów danych, w tym kodu źródłowego, kluczy API i danych osobowych.
- Meta, jeden z kluczowych klientów, bezterminowo zawiesiła współpracę z firmą. OpenAI bada skalę swojego narażenia, ale na razie nie zerwało kontraktu.
- Przeciwko Mercor złożono już pięć pozwów sądowych od kontraktorów, których dane miały zostać skradzione. Stawką jest reputacja i miliard dolarów przychodu.
Jeszcze sześć miesięcy temu Mercor był na ustach wszystkich. Startup zajmujący się trenowaniem danych dla modeli AI pozyskał 350 milionów dolarów w rundzie finansowania serii C, a jego wycena poszybowała do astronomicznych 10 miliardów dolarów. Dziś, zamiast świętować, firma gasi pożary. I to takie, które mogą strawić ją doszczętnie. 31 marca zarząd przyznał, że padł ofiarą cyberataku, otwierając puszkę Pandory, z której wciąż wylatują kolejne demony.
Grupa hakerska, która przyznała się do ataku, twierdzi, że jest w posiadaniu 4 terabajtów danych wykradzionych z systemów Mercor. To niewyobrażalna ilość informacji, rzekomo zawierająca profile kandydatów, dane osobowe, dane pracodawców, a co najgorsze – kod źródłowy i klucze API. Mercor, co zrozumiałe, nabrał wody w usta. Firma nie potwierdziła autentyczności tych rewelacji, ograniczając się do lakonicznego oświadczenia, że prowadzi dochodzenie i “będzie kontynuować komunikację z klientami i kontraktorami”. To dyplomatyczny sposób, by powiedzieć: “wiemy, że jest źle, ale jeszcze nie wiemy, jak bardzo”.
Jak jednorożec o wartości 10 miliardów dolarów wpadł w kłopoty?
Paradoksalnie, przyczyną katastrofy nie był atak wymierzony bezpośrednio w serwery Mercor. Wszystko zaczęło się od popularnego narzędzia open-source o nazwie LiteLLM, które każdego dnia jest pobierane miliony razy. Przez zaledwie 40 minut w jego kodzie ukryte było złośliwe oprogramowanie do kradzieży poświadczeń. To wystarczyło. Hakerzy użyli zdobytych w ten sposób loginów, by dostać się do kolejnych systemów, a tam zbierali kolejne dane uwierzytelniające. Klasyczny, ale niezwykle skuteczny efekt domina.
Mercor, podobnie jak inne firmy z tej branży, przetwarza najcenniejsze sekrety gigantów technologicznych: niestandardowe zestawy danych i procesy używane do trenowania ich modeli AI. To wiedza tak cenna, że nawet Meta, która wydała ponad 14 miliardów dolarów na konkurenta Mercor – firmę Scale AI – nadal korzystała z usług mniejszego partnera. Aż do teraz.
Co dokładnie ukradziono i dlaczego Meta ucieka?
Choć oficjalnego potwierdzenia skali wycieku wciąż brakuje, konsekwencje już widać gołym okiem. Jak donosi magazyn Wired, Meta bezterminowo zawiesiła wszystkie swoje kontrakty z Mercor. To potężny cios, który może zachwiać fundamentami finansowymi firmy. Mercor odmówił komentarza w tej sprawie, co tylko podsyca spekulacje. Atmosfera gęstnieje.
Na horyzoncie widać kolejną chmurę. OpenAI, twórca ChataGPT, również potwierdził, że bada swoje narażenie w związku z włamaniem. Wprawdzie na ten moment nie wstrzymano ani nie zakończono umów, ale przedstawiciele firmy przyglądają się sprawie z uwagą. Źródła TechCrunch sugerują, że inni duzi gracze na rynku modeli językowych również rozważają swoją dalszą współpracę z Mercor. Nazwy firm na razie nie padły, ale nikt nie lubi, gdy jego tajemnice handlowe leżą na wirtualnym stole, dostępne dla każdego, kto wie, gdzie szukać.
Czy to wina jednego narzędzia? O co chodzi w aferze z LiteLLM i Delve?
Sprawa ma też drugie, a nawet trzecie dno. Co najmniej pięciu kontraktorów Mercor złożyło pozwy w związku z rzekomym wyciekiem ich danych osobowych. Jeden z nich, do którego dotarł TechCrunch, pozywa nie tylko Mercor, ale również… LiteLLM oraz firmę Delve. To może wydawać się karkołomne, ale połączenie istnieje. LiteLLM korzystało z usług Delve w celu uzyskania certyfikatów bezpieczeństwa.
Problem w tym, że wokół Delve narosły poważne kontrowersje. Anonimowy sygnalista oskarżył firmę o fałszowanie danych na potrzeby audytów i korzystanie z usług audytorów, którzy bezrefleksyjnie “przybili pieczątkę”. Delve zaprzeczyło zarzutom, ale jednocześnie wprowadziło zmiany operacyjne, a renomowany akcelerator Y Combinator zerwał z nim współpracę. LiteLLM w międzyczasie porzuciło Delve i stara się o nowe certyfikaty u innego dostawcy. Sam Mercor potwierdził, że nie był bezpośrednim klientem Delve, ale smród – jak widać – pozostał i dotarł również do niego.
Na razie nie wiadomo, czy pozwy stanowią realne zagrożenie, czy są jedynie próbą wykorzystania sytuacji. Pomimo tego nie da się ukryć, że reputacyjny kryzys Mercor jest faktem. A stawką są gigantyczne pieniądze. Jak donosi The Information, anonimowe źródło twierdzi, że przed wyciekiem firma zmierzała w tym roku po ponad miliard dolarów rocznego przychodu. Dziś ten cel wydaje się równie odległy, co odzyskanie zaufania największych graczy na rynku.