Skip to content Skip to sidebar Skip to footer

Krypto-masakra w wykonaniu AI. GPT‑5 od OpenAI stracił fortunę w 17 dni. Znamy wyniki!

Sześć modeli AI, w tym GPT‑5 i Gemini, dostało po 10 tys. dolarów na handel krypto. Wynik? Większość poniosła straty do 62%. Wygrał chiński model.

W skrócie:

  • W ramach turnieju Alpha Arena sześć czołowych modeli LLM otrzymało po 10 tys. dolarów, by bez ludzkiej ingerencji handlować na rynku kryptowalut.
  • GPT‑5 od OpenAI okazał się najgorszym inwestorem, tracąc aż 62,7% kapitału. Niewiele lepiej poradziły sobie Gemini od Google (-56,7%) i Grok od xAI (-45,3%).
  • Zwycięzcą rywalizacji został chiński Qwen3-Max od Alibaba z zyskiem 22,3%. Drugie miejsce, również z dodatnim wynikiem, zajął DeepSeek (+4,9%).

Miała być demonstracja siły, pokaz analitycznych możliwości i dowód na to, że sztuczna inteligencja jest gotowa podbić rynki finansowe. Zamiast tego dostaliśmy spektakularną porażkę, która każe zweryfikować hurraoptymistyczne narracje o traderach-botach. Laboratorium badawcze Nof1 zorganizowało turniej Alpha Arena, w którym sześć potężnych modeli językowych rzucono na głęboką wodę – miały zarządzać prawdziwymi pieniędzmi na zmiennym jak pogoda rynku kryptowalut. Efekty? Cóż, powiedzmy, że większość z nich powinna trzymać się z daleka od portfeli inwestorów.

Eksperyment trwał od 18 października do 3 listopada. W szranki stanęły tuzy technologicznego świata: GPT‑5 od OpenAI, Gemini 2.5 Pro od Google, Claude Sonnet 4.5 od Anthropic, a nawet Grok 4, czyli dziecko xAI Elona Muska. Stawkę uzupełniły dwa modele z Chin – DeepSeek v3.1 oraz Qwen3-Max od Alibaby. Każdy z nich dostał na start 10 000 dolarów, takie same dane wejściowe i jedno proste zadanie: handlować. Bez nadzoru, bez podpowiedzi, bez ludzkiej intuicji. Czysta, algorytmiczna walka o zysk.

Jak wysłać AI na giełdę, czyli o co chodziło w Alpha Arena?

Zasady gry były proste, przynajmniej w teorii. Modele AI podłączono do zdecentralizowanej giełdy Hyperliquid, a ich pole manewru ograniczono do otwierania i zamykania długich (long) i krótkich (short) pozycji na sześciu popularnych kryptowalutach: BTC, ETH, SOL, BNB, DOGE i XRP. Organizatorzy z Nof1 podkreślali, że wybór rynku krypto nie był przypadkowy. Jego całodobowa dostępność (24/7) pozwalała na ciągłą obserwację, a obfitość danych ułatwiała analizę i audyt podejmowanych decyzji. Był to więc idealny poligon doświadczalny.

Celem nie było jednak wyłącznie sprawdzenie, który model zarobi najwięcej. Chodziło o coś głębszego – zrozumienie, jak duże modele językowe (LLM), z natury stworzone do przetwarzania tekstu, radzą sobie w świecie liczb, wykresów i nieustannych wahań. Czy potrafią wykształcić strategię? Czy uczą się na błędach? A może po prostu działają chaotycznie, skazane na łaskę losu? Pierwsze dni turnieju pokazały, że droga do stworzenia cyfrowego Warrena Buffetta jest jeszcze bardzo długa. Zwłaszcza dla gigantów z Doliny Krzemowej.

Kto stracił najwięcej? Bolesna lekcja dla gigantów z Zachodu

Wyniki Alpha Arena dla zachodnich modeli AI są, mówiąc delikatnie, druzgocące. Największym przegranym okazał się GPT‑5 od OpenAI, który w ciągu 17 dni zdołał “wyparować” aż 62,7% początkowego kapitału. Z 10 000 dolarów na koncie zostało mu zaledwie 3 733 dolary. To wynik, który na prawdziwym rynku oznaczałby natychmiastową utratę zaufania i, prawdopodobnie, pracy.

Niewiele lepiej poradził sobie Gemini 2.5 Pro od Google, kończąc zawody z wynikiem 4 329 dolarów, co oznacza stratę na poziomie 56,7%. Model Elona Muska, Grok 4, również nie popisał się instynktem inwestora i stracił 45,3% depozytu. Jedynym, który próbował ratować honor Zachodu, był Claude Sonnet 4.5 od Anthropic – jego strata wyniosła “tylko” 30,8%. Wszystkie te modele niemal od samego początku nurkowały pod kreską i do końca turnieju nie zdołały odrobić strat. Wygląda na to, że lingwistyczne talenty nie przekładają się bezpośrednio na smykałkę do spekulacji.

Zaskoczenie z Chin i co dalej z traderami AI?

Gdy amerykańscy giganci liczyli straty, na czele rankingu toczyła się zupełnie inna gra. Dwa chińskie modele, Qwen3-MaxDeepSeek, od początku radziły sobie znakomicie. W pewnym momencie, 27 października, DeepSeek notował nawet zysk przekraczający 130%, podwajając kapitał. Ostatecznie rynkowa korekta nieco ostudziła jego zapał, ale i tak zakończył turniej z dodatnim wynikiem 4,9% (10 489 dolarów).

Triumfatorem pierwszej edycji Alpha Arena został jednak Qwen3-Max od Alibaby. Model ten zakończył rywalizację z kwotą 12 231 dolarów na koncie, co przełożyło się na solidny zysk w wysokości 22,3%. Jay A. Zhang, założyciel Nof1, podsumował eksperyment z dużą dozą ostrożności: “Zaobserwowaliśmy stałe odchylenia w zachowaniu modeli, które utrzymywały się w czasie […]. Ukształtowało się coś na kształt inwestycyjnej ‘osobowości’”.

Zhang przyznał, że zadanie było celowo trudne, ponieważ modele LLM słabo radzą sobie z numerycznymi danymi szeregów czasowych. Zapowiedział już kolejną rundę, Alpha Arena 1.5, w której badacze przetestują nowe strategie i monity. Wszystko wskazuje na to, że era w pełni autonomicznych traderów AI jeszcze nie nadeszła. Co prawda pierwsze koty za płoty, ale na razie przypominają one raczej amatorów z forum dla początkujących inwestorów niż giełdowych rekinów.