ChatGPT z ważną aktualizacją trybu głosowego. Co się zmieniło?

ChatGPT otrzymał kluczową aktualizację trybu głosowego. OpenAI zintegrowało go z głównym oknem czatu, kończąc z niewygodnym podziałem na dwa osobne tryby.

W skrócie:

Tryb głosowy nie jest już osobnym ekranem, lecz integralną częścią głównego wątku czatu, co pozwala na płynne przełączanie się między mówieniem a pisaniem.
Aktualizacja umożliwia jednoczesne prowadzenie rozmowy głosowej i przesyłanie plików, zdjęć czy generowanie obrazów, czego wcześniej nie dało się zrobić.
Użytkownicy, którzy preferują stary układ, mogą przywrócić oddzielny tryb głosowy w ustawieniach aplikacji, zachowując przy tym nowe funkcje multimodalne.

OpenAI wreszcie naprawiło coś, co od dawna irytowało. Ta drobna, niemal kosmetyczna zmiana w aplikacji ChatGPT jest w rzeczywistości cichą rewolucją w interfejsie. Do tej pory rozmowa z AI przypominała trochę wizytę w urzędzie z dwoma różnymi okienkami – w jednym się pisało, a w drugim mówiło. Przejście między nimi oznaczało zerwanie kontekstu i frustrację. Teraz te dwa światy połączono w jeden, a konwersacja z maszyną wreszcie zaczyna przypominać… cóż, konwersację.

Dlaczego ta “mała” zmiana jest tak naprawdę wielka?

Pamiętacie ten absurd? Uruchamialiście tryb głosowy, a aplikacja przechodziła na zupełnie nowy, odizolowany ekran. Chcieliście w trakcie rozmowy wysłać zdjęcie, żeby AI je skomentowało? Niemożliwe. A może podrzucić PDF z danymi do analizy? Zapomnijcie. Tryb głosowy był zamkniętym ogrodem, odciętym od najważniejszych funkcji, które czyniły ChatGPT narzędziem multimodalnym. Użytkownik musiał podejmować absurdalną decyzję: albo mówić, albo korzystać z pełni możliwości czatu. Nigdy jednocześnie. To tak, jakby telefon pozwalał albo dzwonić, albo wysyłać SMS‑y, ale nigdy robić obu rzeczy w ramach jednej interakcji.

Ten sztuczny podział był jedną z tych technologicznych niezręczności, które akceptujemy, bo nie mamy wyboru, ale które po cichu nas irytują. Ograniczał naturalność i spontaniczność. Zmuszał do planowania interakcji, zamiast po prostu pozwolić jej płynąć. Na szczęście ktoś w OpenAI w końcu poszedł po rozum do głowy i zburzył tę niepotrzebną ścianę.

Jak teraz wygląda rozmowa z ChatGPT?

Diabeł, a w tym przypadku anioł, tkwi w szczegółach. Po aktualizacji w głównym oknie czatu tekstowego pojawia się niebieska ikona fal dźwiękowych. Dotykacie jej i zaczynacie mówić. Wasze słowa i odpowiedzi modelu pojawiają się na żywo w tym samym wątku, w którym przed chwilą pisaliście lub wysyłaliście pliki. To otwiera zupełnie nowe scenariusze użycia. Możecie na przykład zrobić zdjęcie fragmentu książki, wysłać je do czatu, a następnie głosowo zapytać: “Opowiedz mi więcej o autorze wspomnianym w tym akapicie”. AI odpowie, a wy możecie płynnie przejść do pisania kolejnego polecenia.

Co więcej, podczas rozmowy głosowej można swobodnie przewijać historię konwersacji, żeby przypomnieć sobie wcześniejszy wątek. ChatGPT może też dynamicznie wyświetlać dodatkowe informacje – mapy, linki czy obrazy generowane w czasie rzeczywistym – bez przerywania dialogu. Rozmowa staje się płynnym, multimedialnym strumieniem, a nie serią oddzielnych, jednowymiarowych komend. Aby zakończyć tryb głosowy, wystarczy dotknąć przycisku “Zakończ”. Proste, intuicyjne i – co najważniejsze – logiczne.

Czy OpenAI zmusi nas do nowości? Nie tym razem

Dla tych, którzy z jakiegoś powodu polubili stary, nieco toporny system, OpenAI zostawiło furtkę. W ustawieniach, w sekcji “Tryb głosowy”, można włączyć opcję “Odrębny tryb” i wrócić do znanego interfejsu. Jest tu jednak pewien zabawny szczegół. Nawet w tym starym trybie firma dodała możliwość przesyłania plików i zdjęć, co jest cichym przyznaniem się, że poprzednie rozwiązanie było po prostu wybrakowane. Innymi słowy, naprawili coś, co – jak sami przyznają – “powinno tak działać od początku”.

Ta aktualizacja to coś więcej niż tylko poprawka użyteczności. To sygnał, w którym kierunku zmierzają interfejsy konwersacyjne. Celem jest całkowite zatarcie granicy między różnymi formami komunikacji – tekstem, głosem i obrazem – tak, by interakcja z AI była równie naturalna, jak rozmowa z drugim człowiekiem. A przynajmniej zbliżała się do tego ideału. To mały krok dla aplikacji, ale spory skok w stronę prawdziwie intuicyjnej sztucznej inteligencji.

ChatGPT właśnie przeszedł rewolucję. Tę zmianę poczujesz od razu.

Dlaczego ta “mała” zmiana jest tak naprawdę wielka?

Jak teraz wygląda rozmowa z ChatGPT?

Czy OpenAI zmusi nas do nowości? Nie tym razem

Paweł Ryter

Warto przeczytać też:

Rekord, w który nie wierzą nawet twórcy. Sierra AI osiągnęła 100 mln dolarów rocznego przychodu w 21 miesięcy

ChatGPT za 16 zł miesięcznie?! OpenAI testuje nowy plan, ale tylko w jednym kraju

Wojna botów: Policja ma własną AI do walki z oszustami. “Możemy sprawić, że przegrają”

Nvidia odpala DLSS 4.5. Gry przyspieszają aż pięciokrotnie, a AI staje się inteligentnym pilotem

Intel tego nie chciał! Haker z pomocą AI złamał zabezpieczenia i uruchomił tajny procesor

Microsoft ujawnia plan dla Europy. Wasze dane są bezpieczniejsze niż myślicie?