OpenAI prezentuje nową wersję ChatGPT Images. Generator obrazów jest do 4x szybszy, lepiej radzi sobie z tekstem i oferuje bardziej realistyczne grafiki.
W skrócie:
- Nowa wersja generatora obrazów w ChatGPT działa nawet cztery razy szybciej, co ma zlikwidować dotychczasowe opóźnienia, zwłaszcza w godzinach szczytowego ruchu.
- Model GPT Image 1.5 znacznie lepiej radzi sobie z renderowaniem tekstu na grafikach, edycją detali oraz zachowaniem spójności przy modyfikowaniu obrazów.
- Wprowadzono dedykowaną sekcję “Obrazy” z nowym interfejsem, gotowymi filtrami i inspiracjami, co ma ułatwić tworzenie grafik mniej zaawansowanym użytkownikom.
Ogłoszony kilka miesięcy temu przez Sama Altmana wewnętrzny “kod czerwony” w OpenAI najwyraźniej przynosi owoce. Po niedawnym wdrożeniu aktualizacji modelu do wersji GPT‑5.2, firma nie zwalnia i serwuje kolejny prezent – tym razem dla tych, którzy używają AI do tworzenia obrazów. OpenAI oficjalnie pokazało światu nowe ChatGPT Images. Wbudowany w chatbota generator ma być nie tylko szybszy, ale też inteligentniejszy i, co tu kryć, po prostu znacznie bardziej użyteczny.
Jak OpenAI odpowiada na presję rynku?
Największa i najbardziej odczuwalna zmiana to prędkość. OpenAI bez ogródek przyznaje, że generowanie obrazów było wąskim gardłem całej usługi, a użytkownicy – szczególnie ci bez płatnej subskrypcji Plus – musieli uzbroić się w cierpliwość. Nowy model ma działać nawet czterokrotnie szybciej. To nie jest tylko kosmetyka. To strategiczna odpowiedź na rosnącą konkurencję, głównie ze strony Google, którego Gemini, napędzane popularnością generatora Nano Banana Pro, regularnie podgryzało pozycję lidera. Skrócenie czasu oczekiwania to więc ruch, który ma utrzymać użytkowników przy sobie.
Nie oszukujmy się, w świecie AI kto stoi w miejscu, ten się cofa. OpenAI doskonale o tym wie i ta aktualizacja to dowód, że firma nie zamierza oddawać pola bez walki. To bezpośrednia reakcja na głosy użytkowników, którzy narzekali na powolne działanie generatora w kluczowych momentach dnia.
Co potrafi nowy model GPT Image 1.5?
Sama prędkość to jednak za mało, by wygrać wyścig. Sercem nowej usługi jest model nazwany GPT Image 1.5, udostępniany zarówno w interfejsie ChatGPT, jak i przez API. Jego główną zaletą ma być znacznie lepsze rozumienie poleceń. OpenAI podkreśla, że generator wreszcie radzi sobie z precyzyjną edycją istniejących grafik. Potrafi dodawać i usuwać elementy bez fundamentalnej zmiany całej kompozycji – to koniec z sytuacjami, gdy prośba o zmianę koloru kapelusza kończyła się wygenerowaniem zupełnie nowej postaci. To była jedna z największych bolączek poprzedniej wersji.
Kolejny przełom dotyczy renderowania tekstu. Generatory obrazów od lat miały z tym gigantyczny problem, tworząc typograficzne koszmarki przypominające inskrypcje z obcej cywilizacji. Według zapowiedzi, nowy ChatGPT Images radzi sobie ze składaniem liter znacznie lepiej, co otwiera drogę do tworzenia funkcjonalnych plakatów, infografik czy prostych materiałów marketingowych. Ponadto firma chwali się lepszym odwzorowaniem detali, na przykład przy generowaniu scen z wieloma twarzami, oraz ogólną “naturalnością” scen, która ma zmniejszyć efekt sztuczności.
Nowy interfejs to ukłon w stronę laików?
Równolegle z wdrożeniem nowego modelu, OpenAI przebudowało interfejs samego chatbota. W bocznym pasku nawigacyjnym pojawiła się dedykowana sekcja “Obrazy”, którą firma opisuje jako rodzaj kreatywnego studia. To sprytne posunięcie. Użytkownicy dostają tam dostęp do gotowych filtrów i inspirujących promptów, które można aktywować jednym kliknięciem. Nie trzeba już być mistrzem w pisaniu skomplikowanych poleceń, by uzyskać ciekawy efekt.
Wszystko wskazuje na to, że OpenAI chce, by generowanie obrazów stało się jeszcze bardziej masowe. Upraszczając proces, firma otwiera się na zupełnie nową grupę odbiorców – menedżerów, marketerów, naukowców, a nawet przypadkowych użytkowników, którzy dotąd bali się skomplikowanych narzędzi. To także sygnał, że generatory AI stają się produktem, a nie tylko technologiczną ciekawostką dla entuzjastów.
Nowa wersja ChatGPT Images jest już dostępna dla wszystkich użytkowników na całym świecie. Co ciekawe, OpenAI nie usuwa poprzedniej wersji generatora. Będzie ona nadal dostępna jako niestandardowy model GPT, co z pewnością ucieszy tych, którzy przyzwyczaili się do jej specyficznego stylu. Jednocześnie firma studzi entuzjazm i przyznaje, że pomimo ogromnego postępu, model wciąż ma swoje ograniczenia. Droga do perfekcji jest jeszcze długa, ale ten krok jest bez wątpienia jednym z najważniejszych w ostatnim czasie.