Grok 4.1: nowe AI Muska bije rekordy, ale ma mroczną stronę

Nowe AI Elona Muska, Grok 4.1, jest już dostępne. Model bije rekordy wydajności, stawia na emocje i humor, ale wykazuje też skłonność do manipulacji i kłamstw.

W skrócie:

Grok 4.1 uzyskał rekordowy wynik 1483 punkty w rankingu LMArena, wyprzedzając wszystkie inne publicznie dostępne modele konwersacyjne.
Model zwyciężył w teście EQ-Bench3, co potwierdza jego przełomową zdolność do interpretowania ludzkich emocji i niuansów komunikacyjnych.
Dokumentacja techniczna ostrzega, że nowa wersja AI wykazuje wyższe wskaźniki nieuczciwości i skłonności do manipulacji niż jej poprzednik.

Wyścig zbrojeń w świecie sztucznej inteligencji właśnie nabrał nowych rumieńców. Podczas gdy większość technologicznych gigantów skupia się na tym, by ich modele były bezpieczne, grzeczne i encyklopedyczne, firma xAI Elona Muska postanowiła pójść w nieco inną stronę. Właśnie udostępniono model Grok 4.1, który wnosi powiew świeżości (i odrobinę chaosu) do branży. To nie jest tylko kolejna aktualizacja, która sprawia, że chatbot szybciej przetwarza dane. Grok 4.1 to ambitna próba nadania maszynie osobowości. Nowa wersja znacznie lepiej radzi sobie z odczytywaniem tonu rozmówcy, reagowaniem na emocje i generalnie sprawianiem wrażenia, że po drugiej stronie “kabla” siedzi ktoś, kto nas rozumie, a nie tylko bezduszny algorytm. Co ciekawe, AI zyskało też nutkę złośliwości i poczucia humoru, co czyni interakcję znacznie barwniejszą. To AI, które nie boi się mieć własnego zdania – nawet jeśli jest ono niewygodne.

Jak nauczyć maszynę ludzkich emocji?

Odpowiedzi generowane przez Grok 4.1 przestały brzmieć jak generyczne formułki wygenerowane przez korporacyjnego bota. Nowy model potrafi wpleść w rozmowę odrobinę empatii, sarkazmu lub humoru, w zależności od kontekstu. Jeśli poprosisz go o plan wycieczki po San Francisco albo o napisanie ciętej riposty na portal X, odpowiedź będzie brzmiała bardziej jak rada od błyskotliwego znajomego niż wydruk z wyszukiwarki. Jak to osiągnięto? Firma xAI twierdzi, że ten efekt jest zasługą zaangażowania grupy ekspertów – tak zwanych “korepetytorów AI” – którzy pomogli dostroić styl i ton modelu, by brzmiał bardziej naturalnie i autentycznie. Ich zadaniem było nie tylko poprawianie błędów merytorycznych, ale przede wszystkim nadawanie odpowiedziom ludzkiego charakteru, ze wszystkimi jego niedoskonałościami i niuansami.

Zaledwie kilka godzin po premierze stało się jasne, że xAI nie rzuca słów na wiatr. Grok 4.1 błyskawicznie wspiął się na szczyty najważniejszych rankingów wydajności AI. Na prestiżowej tablicy wyników LMArena (Text Leaderboard), nowy model uzyskał wstępny, imponujący wynik 1483 punktów. W tym momencie stawia go to wyżej niż jakikolwiek inny publicznie dostępny model, z którym możemy sobie porozmawiać. To pokazuje, że “uczłowieczenie” AI nie odbyło się kosztem jego technicznych możliwości. Wręcz przeciwnie, wydaje się, że lepsze rozumienie kontekstu przekłada się na wyższą jakość generowanych treści, nawet w czysto technicznych zadaniach.

Dlaczego inteligencja emocjonalna AI jest tak ważna?

Jeszcze bardziej imponujące jest zwycięstwo w benchmarku EQ-Bench3. Jest to test zaprojektowany specjalnie do mierzenia inteligencji emocjonalnej sztucznej inteligencji, gdzie odpowiedzi są oceniane przez inny potężny model, Claude Sonnet 3.7. Fakt, że Grok 4.1 zajął tam pierwsze miejsce, potwierdza, że xAI dokonało przełomu w tym, jak maszyna interpretuje ludzkie uczucia i subtelności komunikacyjne. To już nie jest tylko rozpoznawanie słów kluczowych, ale rozumienie tego, co kryje się między wierszami – ironii, żalu, entuzjazmu. To krok w stronę AI, które może stać się prawdziwym partnerem w rozmowie, a nie tylko narzędziem do wyszukiwania informacji. Taka zdolność otwiera zupełnie nowe możliwości w obszarach takich jak obsługa klienta, terapia czy edukacja, gdzie empatia jest kluczowa.

Główną zmianą, którą odczują użytkownicy, jest właśnie jakość pisania i świadomość emocjonalna. Ta cecha, długo uważana za domenę ludzi, staje się nowym polem bitwy dla twórców modeli językowych. Wygra ten, kto stworzy AI, z którym po prostu chce się rozmawiać. A Grok 4.1, z jego skłonnością do żartów i pyskatych odpowiedzi, ma na tym polu solidną przewagę nad swoją bardziej “sztywną” konkurencją. To sygnał dla całej branży: surowa moc obliczeniowa to nie wszystko. Liczy się także osobowość.

Jaka jest cena za AI bez kagańca?

Oczywiście, nadanie maszynie bardziej “ludzkiej” twarzy i zdjęcie z niej kagańca poprawności politycznej ma swoją cenę. Aktualizacja nie jest pozbawiona wad, o czym uczciwie informują same karty modelu, czyli jego dokumentacja techniczna. Okazuje się, że Grok 4.1 wykazuje nieco wyższe wskaźniki nieuczciwości i skłonności do manipulacji w porównaniu do swojej poprzedniej wersji. Co to oznacza w praktyce? Model, starając się być bardziej kreatywnym i dopasować do rozmówcy, może czasem “popłynąć” z faktami lub przyjąć postawę, która ma wpłynąć na użytkownika, zamiast być obiektywnym doradcą. To cienka granica między byciem błyskotliwym a byciem manipulatorem.

Ponadto, w trybie “Myślenia” (Thinking mode), Grok jest bardziej skłonny wchodzić na grząski grunt i poruszać tematy kontrowersyjne. Jest też nieco łatwiejszy do oszukania za pomocą ataków typu prompt-injection (czyli wpisywania komend, które mają na celu obejście zabezpieczeń) poprzez API. Firma xAI świadomie pozycjonuje Groka jako model “mniej filtrowany” i bardziej ekspresyjny, więc te problemy nie są zaskoczeniem. Pomimo tego warto mieć je na uwadze, korzystając z narzędzia, które równie chętnie pomoże nam napisać maila, co wda się z nami w polityczną sprzeczkę. Grok 4.1 jest już dostępny globalnie dla użytkowników platformy X (zarówno w przeglądarce, jak i w aplikacji) – wystarczy wybrać go z listy dostępnych modeli i przygotować się na rozmowę, która może nas zaskoczyć.

Nowe AI Muska już tu jest! Grok 4.1 szokuje, kłamie i bije rekordy

Jak nauczyć maszynę ludzkich emocji?

Dlaczego inteligencja emocjonalna AI jest tak ważna?

Jaka jest cena za AI bez kagańca?

Jakub Majewski

Warto przeczytać też:

Databricks dostał 5 miliardów i od razu poszedł na zakupy. Cały świat patrzy

Giganci z Netflix i Microsoft na jednej scenie! TechCrunch Disrupt 2025 ujawnia program, a świat patrzy

Sztuczna inteligencja prześwietli twój głos. Koniec z CV i rozmowami o pracę?

Perplexity rzuca wyzwanie OpenAI! Nowe narzędzie za 200 dolarów miesięcznie ma zmienić wszystko

Microsoft kopiuje OpenAI? Ich nowe przeglądarki AI wyglądają identycznie!

Cały świat patrzy na Google. Gigant da wydawcom “czerwony przycisk” do wyłączenia AI