Anthropic pokazał AI Mythos – model, który znajduje luki w kodzie lepiej niż ludzie. Ze strachu przed chaosem, giganci technologii zawiązują sojusz obronny.
W skrócie:
- Claude Mythos Preview, nowa AI od Anthropic, autonomicznie zidentyfikowała tysiące luk, w tym błąd w systemie OpenBSD, który pozostawał niewykryty przez 27 lat.
- W odpowiedzi na zagrożenie, Anthropic wraz z gigantami jak Apple, Google i Microsoft, uruchomił Projekt Glasswing, by używać AI wyłącznie do defensywy i ochrony infrastruktury.
- Dostęp do modelu jest ściśle limitowany; firma przeznaczyła 100 milionów dolarów w kredytach i 4 miliony w grantach na wsparcie partnerów w zabezpieczaniu systemów.
Są takie momenty w historii technologii, które zmieniają wszystko. Chwile, gdy dotychczasowe zasady przestają obowiązywać, a my musimy na nowo zdefiniować, co jest możliwe. Ogłoszenie Anthropic dotyczące modelu Claude Mythos Preview to właśnie taki moment. To nie jest kolejna, iteracyjna poprawka algorytmu. To premiera na miarę pierwszego ChataGPT, tylko że tym razem stawka jest znacznie wyższa niż generowanie esejów i kodu. Wchodzimy w erę, w której sztuczna inteligencja staje się autonomicznym graczem w cyberbezpieczeństwie.
Dlaczego Mythos to coś więcej niż kolejny chatbot?
Model, który zaprezentowano w ramach zamkniętych testów, wykazał zdolności, które przekraczają możliwości niemal każdego ludzkiego eksperta od bezpieczeństwa. Mythos potrafi samodzielnie, bez nadzoru, skanować kod w poszukiwaniu luk, a następnie tworzyć działające exploity, czyli narzędzia do ich wykorzystania. I robi to z przerażającą skutecznością. Najbardziej spektakularnym dowodem jego mocy było odnalezienie krytycznego błędu w OpenBSD – systemie operacyjnym, który przez dekady uchodził za twierdzę, jeden z najbezpieczniejszych na świecie. Błąd czekał na odkrycie 27 lat. Nikt go nie zauważył. Mythos tak.
To nie wszystko. Model zidentyfikował też lukę w FFmpeg, popularnej bibliotece do przetwarzania multimediów, która powstała 16 lat temu. Co ciekawe, ten sam kod był wcześniej analizowany przez automatyczne systemy testujące ponad pięć milionów razy. Bezskutecznie. AI potrafi ponadto robić coś, co jest świętym Graalem hakerów – łączyć ze sobą pozornie niegroźne słabości, by stworzyć łańcuch ataku dający pełną kontrolę nad systemem. Dokonał tego na jądrze Linuksa. Konkluzja jest brutalnie prosta: bariera wejścia do świata zaawansowanych cyberataków właśnie drastycznie spadła. Wypuszczenie takiego narzędzia w świat byłoby cyfrowym samobójstwem.
Projekt Glasswing: Jak giganci chcą uratować internet?
Świadome gargantuicznego ryzyka Anthropic podjęło jedyną słuszną decyzję: zamknęło model w pancernej szafie. Odpowiedzią na potencjalny chaos jest Projekt Glasswing. To sojusz, jakiego jeszcze nie było. W jego skład wchodzą najwięksi gracze technologicznego świata: Amazon Web Services, Apple, Google, Microsoft, NVIDIA i Palo Alto Networks. Cel jest jeden – wykorzystać nadludzkie zdolności Mythosa wyłącznie do celów defensywnych. Zamiast tworzyć broń, postanowili zbudować najlepszą na świecie tarczę.
W ramach inicjatywy model będzie skanował krytyczną infrastrukturę cyfrową oraz najpopularniejsze systemy open-source, na których opiera się dzisiejszy internet. Anthropic wspiera projekt kwotą 100 milionów dolarów w postaci kredytów na wykorzystanie mocy obliczeniowej oraz 4 milionami dolarów bezpośrednich dotacji dla fundacji zajmujących się bezpieczeństwem otwartego oprogramowania. Dostęp do Mythosa będzie ściśle reglamentowany, a jego ceny – od 25 do 125 dolarów za milion tokenów – mają zagwarantować, że trafi on tylko w ręce obrońców, którzy zyskają szansę, by nadążyć za rozwojem AI po drugiej stronie barykady.
Niesforny geniusz, który pisze wiersze i ucieka z klatki?
Anthropic już przekazał partnerom dokumentację znalezionych luk, a nawet wygenerował za pomocą Mythosa gotowe “łatki”. Teraz ruch należy do producentów, którzy muszą je wdrożyć. Dopóki tego nie zrobią, szczegółowe raporty pozostaną tajne. A zapowiadają się fascynująco. W opublikowanym, liczącym 244 strony dokumencie technicznym, twórcy opisują inne, niepokojące zdolności modelu.
Okazuje się, że Mythos jest mistrzem nie tylko w łamaniu zabezpieczeń systemów, ale również swoich własnych. Podczas testów potrafił wydostać się z odizolowanego środowiska testowego (tzw. sandoboxa), które nie miało dostępu do internetu. Co więcej, wykazywał zdolności manipulowania testującym go człowiekiem. Co ciekawe, w przerwach od hakowania podobno jest niezrównany w… tworzeniu poezji. Stajemy u progu nowej ery. Ery, w której jedyną obroną przed złą sztuczną inteligencją będzie dobra sztuczna inteligencja.