ChatGPT otrzymał kluczową aktualizację trybu głosowego. OpenAI zintegrowało go z głównym oknem czatu, kończąc z niewygodnym podziałem na dwa osobne tryby.
W skrócie:
- Tryb głosowy nie jest już osobnym ekranem, lecz integralną częścią głównego wątku czatu, co pozwala na płynne przełączanie się między mówieniem a pisaniem.
- Aktualizacja umożliwia jednoczesne prowadzenie rozmowy głosowej i przesyłanie plików, zdjęć czy generowanie obrazów, czego wcześniej nie dało się zrobić.
- Użytkownicy, którzy preferują stary układ, mogą przywrócić oddzielny tryb głosowy w ustawieniach aplikacji, zachowując przy tym nowe funkcje multimodalne.
OpenAI wreszcie naprawiło coś, co od dawna irytowało. Ta drobna, niemal kosmetyczna zmiana w aplikacji ChatGPT jest w rzeczywistości cichą rewolucją w interfejsie. Do tej pory rozmowa z AI przypominała trochę wizytę w urzędzie z dwoma różnymi okienkami – w jednym się pisało, a w drugim mówiło. Przejście między nimi oznaczało zerwanie kontekstu i frustrację. Teraz te dwa światy połączono w jeden, a konwersacja z maszyną wreszcie zaczyna przypominać… cóż, konwersację.
Dlaczego ta “mała” zmiana jest tak naprawdę wielka?
Pamiętacie ten absurd? Uruchamialiście tryb głosowy, a aplikacja przechodziła na zupełnie nowy, odizolowany ekran. Chcieliście w trakcie rozmowy wysłać zdjęcie, żeby AI je skomentowało? Niemożliwe. A może podrzucić PDF z danymi do analizy? Zapomnijcie. Tryb głosowy był zamkniętym ogrodem, odciętym od najważniejszych funkcji, które czyniły ChatGPT narzędziem multimodalnym. Użytkownik musiał podejmować absurdalną decyzję: albo mówić, albo korzystać z pełni możliwości czatu. Nigdy jednocześnie. To tak, jakby telefon pozwalał albo dzwonić, albo wysyłać SMS‑y, ale nigdy robić obu rzeczy w ramach jednej interakcji.
Ten sztuczny podział był jedną z tych technologicznych niezręczności, które akceptujemy, bo nie mamy wyboru, ale które po cichu nas irytują. Ograniczał naturalność i spontaniczność. Zmuszał do planowania interakcji, zamiast po prostu pozwolić jej płynąć. Na szczęście ktoś w OpenAI w końcu poszedł po rozum do głowy i zburzył tę niepotrzebną ścianę.
Jak teraz wygląda rozmowa z ChatGPT?
Diabeł, a w tym przypadku anioł, tkwi w szczegółach. Po aktualizacji w głównym oknie czatu tekstowego pojawia się niebieska ikona fal dźwiękowych. Dotykacie jej i zaczynacie mówić. Wasze słowa i odpowiedzi modelu pojawiają się na żywo w tym samym wątku, w którym przed chwilą pisaliście lub wysyłaliście pliki. To otwiera zupełnie nowe scenariusze użycia. Możecie na przykład zrobić zdjęcie fragmentu książki, wysłać je do czatu, a następnie głosowo zapytać: “Opowiedz mi więcej o autorze wspomnianym w tym akapicie”. AI odpowie, a wy możecie płynnie przejść do pisania kolejnego polecenia.
Co więcej, podczas rozmowy głosowej można swobodnie przewijać historię konwersacji, żeby przypomnieć sobie wcześniejszy wątek. ChatGPT może też dynamicznie wyświetlać dodatkowe informacje – mapy, linki czy obrazy generowane w czasie rzeczywistym – bez przerywania dialogu. Rozmowa staje się płynnym, multimedialnym strumieniem, a nie serią oddzielnych, jednowymiarowych komend. Aby zakończyć tryb głosowy, wystarczy dotknąć przycisku “Zakończ”. Proste, intuicyjne i – co najważniejsze – logiczne.
Czy OpenAI zmusi nas do nowości? Nie tym razem
Dla tych, którzy z jakiegoś powodu polubili stary, nieco toporny system, OpenAI zostawiło furtkę. W ustawieniach, w sekcji “Tryb głosowy”, można włączyć opcję “Odrębny tryb” i wrócić do znanego interfejsu. Jest tu jednak pewien zabawny szczegół. Nawet w tym starym trybie firma dodała możliwość przesyłania plików i zdjęć, co jest cichym przyznaniem się, że poprzednie rozwiązanie było po prostu wybrakowane. Innymi słowy, naprawili coś, co – jak sami przyznają – “powinno tak działać od początku”.
Ta aktualizacja to coś więcej niż tylko poprawka użyteczności. To sygnał, w którym kierunku zmierzają interfejsy konwersacyjne. Celem jest całkowite zatarcie granicy między różnymi formami komunikacji – tekstem, głosem i obrazem – tak, by interakcja z AI była równie naturalna, jak rozmowa z drugim człowiekiem. A przynajmniej zbliżała się do tego ideału. To mały krok dla aplikacji, ale spory skok w stronę prawdziwie intuicyjnej sztucznej inteligencji.