OpenAI GPT-5-Codex: Nowy model AI "myśli" nawet 7 godzin

OpenAI wprowadza GPT-5-Codex, nową wersję modelu dla programistów. AI może teraz “myśleć” nad zadaniem od kilku sekund do nawet siedmiu godzin. To rewolucja.

W skrócie:

OpenAI wypuściło GPT-5-Codex, nową wersję modelu AI do kodowania, która dynamicznie dostosowuje czas pracy nad zadaniem – od sekund do wielu godzin.
Nowy model osiąga znacznie lepsze wyniki w testach porównawczych, takich jak SWE-bench Verified, deklasując poprzednie wersje w zadaniach programistycznych.
Narzędzie jest już dostępne dla subskrybentów ChatGPT Plus, Pro, Business, Edu i Enterprise. W przyszłości trafi również do klientów korzystających z API.

Wojna na rynku narzędzi AI dla programistów wchodzi w nową, fascynującą fazę. OpenAI, zamiast odcinać kupony od popularności ChatGPT, właśnie rzuciło na stół kartę, która może kompletnie przetasować układ sił. Firma ogłosiła premierę GPT-5-Codex, nowej wersji swojego agenta do kodowania. To nie jest zwykła aktualizacja. To fundamentalna zmiana filozofii działania, która pozwala modelowi na coś, co dotąd było domeną ludzkich ekspertów – głęboki, wielogodzinny namysł nad problemem. Konkurencja ma powody do niepokoju.

Jak działa AI, które myśli przez siedem godzin?

Największą innowacją w GPT-5-Codex jest jego zdolność do dynamicznego zarządzania “czasem namysłu”. Poprzednie modele działały raczej zero-jedynkowo – otrzymywały zadanie i od razu przystępowały do jego rozwiązania, z góry określonym zasobem mocy obliczeniowej. Nowa wersja, jak tłumaczy szef produktu Codex w OpenAI, Alexander Embiricos, działa inaczej. Model potrafi w czasie rzeczywistym ocenić złożoność problemu i zdecydować, ile czasu i energii musi na niego poświęcić. Nie ma tu żadnego routera, który na starcie decyduje za niego.

W praktyce oznacza to, że proste zadanie może zostać wykonane w kilka sekund. Jeśli jednak algorytm napotka coś naprawdę skomplikowanego, może pracować nad rozwiązaniem znacznie dłużej. Embiricos przyznał, że obserwował przypadki, w których GPT-5-Codex poświęcał na jedno zadanie programistyczne… ponad siedem godzin. To przełom. Zamiast szybkiej, często powierzchownej odpowiedzi, dostajemy maszynę zdolną do analitycznej, wieloetapowej pracy, która bardziej przypomina proces twórczy doświadczonego dewelopera niż automatyczny skrypt.

Dlaczego OpenAI musiało przyspieszyć na froncie kodu?

Odpowiedź jest prosta: pieniądze i prestiż. Rynek narzędzi do kodowania wspieranych przez AI eksplodował w ostatnim roku. To już nie jest niszowa ciekawostka, ale potężny segment, w którym toczy się bezpardonowa walka o programistów. Na polu bitwy OpenAI mierzy się z takimi graczami jak Claude Code, Microsoft z jego wszechobecnym GitHub Copilot czy rewelacja ostatniego roku – edytor Cursor od Anysphere, który na początku 2025 roku przekroczył 500 milionów dolarów rocznego przychodu (ARR).

Presja jest ogromna. Użytkownicy stali się wymagający, a konkurencja nie śpi. Wystarczy wspomnieć niedawną, chaotyczną próbę przejęcia innego edytora, Windsurf, o którego zespół walczyły jednocześnie Google i Cognition. W takim otoczeniu OpenAI nie mogło sobie pozwolić na stagnację. Firma musiała pokazać, że jej technologia wciąż wyznacza standardy. I zrobiła to w swoim stylu – nie poprzez drobne poprawki, ale wprowadzając mechanizm, który redefiniuje możliwości AI w tej konkretnej dziedzinie.

Czy AI może być lepszym recenzentem kodu niż człowiek?

Jednym z najbardziej intrygujących zastosowań nowego modelu jest jego zdolność do przeprowadzania przeglądu kodu (code review). To kluczowy, ale często czasochłonny element pracy w zespołach programistycznych. OpenAI postanowiło sprawdzić, jak GPT-5-Codex radzi sobie w roli krytycznego oka, które wyłapuje błędy i sugeruje poprawki. Wyniki są obiecujące. Do oceny komentarzy generowanych przez AI zaproszono doświadczonych inżynierów oprogramowania.

Ich werdykt? Model nie tylko popełniał mniej błędnych uwag niż jego poprzednicy, ale co ważniejsze, dodawał więcej “komentarzy o dużym wpływie” (high-impact comments). To uwagi, które dotyczą architektury, logiki i potencjalnych problemów wydajnościowych, a nie tylko kosmetyki kodu. Wygląda na to, że GPT-5-Codex potrafi spojrzeć na kod z szerszej perspektywy, co czyni go potężnym partnerem dla każdego dewelopera. I choć jeszcze za wcześnie, by mówić o zastąpieniu ludzi, z pewnością jest to krok w stronę prawdziwej, inteligentnej automatyzacji, która odciąży programistów od najbardziej żmudnych zadań.

7 godzin “myślenia” nad kodem. OpenAI pokazało bestię. Eksperci w szoku.

Jak działa AI, które myśli przez siedem godzin?

Dlaczego OpenAI musiało przyspieszyć na froncie kodu?

Czy AI może być lepszym recenzentem kodu niż człowiek?

Aleksandra Wilk

Warto przeczytać też:

Szef Nvidii ogłasza erę AGI, by po chwili sam w to zwątpić. O co tu chodzi?

Prezes Nvidii do graczy: „Jesteście w błędzie”. Awantura o duszę gier i AI w DLSS 5

Zegar tyka bezlitośnie. Kto zdąży zająć ostatnie miejsca na TechCrunch Disrupt 2025?

Google rzuca wyzwanie korepetytorom. Gemini przygotuje cię do matury za darmo!

Agenci AI to koń trojański w Twojej sieci? Jedna komenda może wygenerować tygodniowy ruch

Koniec żartów z Siri. Apple Intelligence to rewolucja, na którą czekaliśmy?