AI traci na kryptowalutach. Wyniki testu GPT-5 i Gemini

Sześć modeli AI, w tym GPT‑5 i Gemini, dostało po 10 tys. dolarów na handel krypto. Wynik? Większość poniosła straty do 62%. Wygrał chiński model.

W skrócie:

W ramach turnieju Alpha Arena sześć czołowych modeli LLM otrzymało po 10 tys. dolarów, by bez ludzkiej ingerencji handlować na rynku kryptowalut.
GPT‑5 od OpenAI okazał się najgorszym inwestorem, tracąc aż 62,7% kapitału. Niewiele lepiej poradziły sobie Gemini od Google (-56,7%) i Grok od xAI (-45,3%).
Zwycięzcą rywalizacji został chiński Qwen3-Max od Alibaba z zyskiem 22,3%. Drugie miejsce, również z dodatnim wynikiem, zajął DeepSeek (+4,9%).

Miała być demonstracja siły, pokaz analitycznych możliwości i dowód na to, że sztuczna inteligencja jest gotowa podbić rynki finansowe. Zamiast tego dostaliśmy spektakularną porażkę, która każe zweryfikować hurraoptymistyczne narracje o traderach-botach. Laboratorium badawcze Nof1 zorganizowało turniej Alpha Arena, w którym sześć potężnych modeli językowych rzucono na głęboką wodę – miały zarządzać prawdziwymi pieniędzmi na zmiennym jak pogoda rynku kryptowalut. Efekty? Cóż, powiedzmy, że większość z nich powinna trzymać się z daleka od portfeli inwestorów.

Eksperyment trwał od 18 października do 3 listopada. W szranki stanęły tuzy technologicznego świata: GPT‑5 od OpenAI, Gemini 2.5 Pro od Google, Claude Sonnet 4.5 od Anthropic, a nawet Grok 4, czyli dziecko xAI Elona Muska. Stawkę uzupełniły dwa modele z Chin – DeepSeek v3.1 oraz Qwen3-Max od Alibaby. Każdy z nich dostał na start 10 000 dolarów, takie same dane wejściowe i jedno proste zadanie: handlować. Bez nadzoru, bez podpowiedzi, bez ludzkiej intuicji. Czysta, algorytmiczna walka o zysk.

Jak wysłać AI na giełdę, czyli o co chodziło w Alpha Arena?

Zasady gry były proste, przynajmniej w teorii. Modele AI podłączono do zdecentralizowanej giełdy Hyperliquid, a ich pole manewru ograniczono do otwierania i zamykania długich (long) i krótkich (short) pozycji na sześciu popularnych kryptowalutach: BTC, ETH, SOL, BNB, DOGE i XRP. Organizatorzy z Nof1 podkreślali, że wybór rynku krypto nie był przypadkowy. Jego całodobowa dostępność (24/7) pozwalała na ciągłą obserwację, a obfitość danych ułatwiała analizę i audyt podejmowanych decyzji. Był to więc idealny poligon doświadczalny.

Celem nie było jednak wyłącznie sprawdzenie, który model zarobi najwięcej. Chodziło o coś głębszego – zrozumienie, jak duże modele językowe (LLM), z natury stworzone do przetwarzania tekstu, radzą sobie w świecie liczb, wykresów i nieustannych wahań. Czy potrafią wykształcić strategię? Czy uczą się na błędach? A może po prostu działają chaotycznie, skazane na łaskę losu? Pierwsze dni turnieju pokazały, że droga do stworzenia cyfrowego Warrena Buffetta jest jeszcze bardzo długa. Zwłaszcza dla gigantów z Doliny Krzemowej.

Kto stracił najwięcej? Bolesna lekcja dla gigantów z Zachodu

Wyniki Alpha Arena dla zachodnich modeli AI są, mówiąc delikatnie, druzgocące. Największym przegranym okazał się GPT‑5 od OpenAI, który w ciągu 17 dni zdołał “wyparować” aż 62,7% początkowego kapitału. Z 10 000 dolarów na koncie zostało mu zaledwie 3 733 dolary. To wynik, który na prawdziwym rynku oznaczałby natychmiastową utratę zaufania i, prawdopodobnie, pracy.

Niewiele lepiej poradził sobie Gemini 2.5 Pro od Google, kończąc zawody z wynikiem 4 329 dolarów, co oznacza stratę na poziomie 56,7%. Model Elona Muska, Grok 4, również nie popisał się instynktem inwestora i stracił 45,3% depozytu. Jedynym, który próbował ratować honor Zachodu, był Claude Sonnet 4.5 od Anthropic – jego strata wyniosła “tylko” 30,8%. Wszystkie te modele niemal od samego początku nurkowały pod kreską i do końca turnieju nie zdołały odrobić strat. Wygląda na to, że lingwistyczne talenty nie przekładają się bezpośrednio na smykałkę do spekulacji.

Zaskoczenie z Chin i co dalej z traderami AI?

Gdy amerykańscy giganci liczyli straty, na czele rankingu toczyła się zupełnie inna gra. Dwa chińskie modele, Qwen3-Max i DeepSeek, od początku radziły sobie znakomicie. W pewnym momencie, 27 października, DeepSeek notował nawet zysk przekraczający 130%, podwajając kapitał. Ostatecznie rynkowa korekta nieco ostudziła jego zapał, ale i tak zakończył turniej z dodatnim wynikiem 4,9% (10 489 dolarów).

Triumfatorem pierwszej edycji Alpha Arena został jednak Qwen3-Max od Alibaby. Model ten zakończył rywalizację z kwotą 12 231 dolarów na koncie, co przełożyło się na solidny zysk w wysokości 22,3%. Jay A. Zhang, założyciel Nof1, podsumował eksperyment z dużą dozą ostrożności: “Zaobserwowaliśmy stałe odchylenia w zachowaniu modeli, które utrzymywały się w czasie […]. Ukształtowało się coś na kształt inwestycyjnej ‘osobowości’”.

Zhang przyznał, że zadanie było celowo trudne, ponieważ modele LLM słabo radzą sobie z numerycznymi danymi szeregów czasowych. Zapowiedział już kolejną rundę, Alpha Arena 1.5, w której badacze przetestują nowe strategie i monity. Wszystko wskazuje na to, że era w pełni autonomicznych traderów AI jeszcze nie nadeszła. Co prawda pierwsze koty za płoty, ale na razie przypominają one raczej amatorów z forum dla początkujących inwestorów niż giełdowych rekinów.

Krypto-masakra w wykonaniu AI. GPT‑5 od OpenAI stracił fortunę w 17 dni. Znamy wyniki!

Jak wysłać AI na giełdę, czyli o co chodziło w Alpha Arena?

Kto stracił najwięcej? Bolesna lekcja dla gigantów z Zachodu

Zaskoczenie z Chin i co dalej z traderami AI?

Paweł Ryter

Warto przeczytać też:

AI kradnie nam wspomnienia. Historia rodziny z Google Maps to oszustwo

AI tworzy całe światy ze zdjęć i tekstu. Premiera Marble od World Labs ma wstrząsnąć rynkiem gier i VR

Traktory z neuronami? Sztuczna inteligencja zmienia polską wieś

Samsung i Google ujawniają rewolucję. Nowy telefon sam zamówi ci Ubera i jedzenie

Giganci z Netflix i Microsoft na jednej scenie! TechCrunch Disrupt 2025 ujawnia program, a świat patrzy

Twoja AI właśnie dostała własny e‑mail. AgentMail ujawnia szczegóły po rundzie 6 mln $