Google Veo 3.1: Nowy model AI do wideo z dźwiękiem i edycją

Google wypuszcza Veo 3.1, nową wersję modelu AI do wideo. Potrafi generować dźwięk, dodawać i usuwać obiekty oraz tworzyć bardziej realistyczne klipy. To rewolucja?

W skrócie:

Google zaprezentowało Veo 3.1, nową wersję swojego modelu do generowania wideo, który teraz tworzy klipy z dźwiękiem i oferuje znacznie większy realizm.
Nowe narzędzia edycyjne pozwalają dodawać obiekty do gotowych filmów i wkrótce umożliwią ich usuwanie, a wszystko to z poziomu edytora Flow.
Model jest już dostępny w aplikacji Gemini, edytorze Flow oraz przez API dla deweloperów. Od maja w samym Flow powstało ponad 275 milionów filmów.

Google nie zwalnia obrotów w wyścigu o dominację na rynku generatywnej sztucznej inteligencji. Zaledwie kilka miesięcy po premierze modelu Veo 3, firma wypuszcza jego ulepszoną wersję – Veo 3.1. I nie jest to kosmetyczna aktualizacja. Nowy model wnosi funkcje, które do niedawna wydawały się domeną profesjonalnych studiów postprodukcyjnych. Mówimy o generowaniu spójnej ścieżki dźwiękowej, manipulacji obiektami wewnątrz gotowego klipu i poziomie realizmu, który po raz kolejny każe nam zadać sobie pytanie – gdzie leży granica między tym, co prawdziwe, a tym, co wygenerowane?

Aktualizacja, która trafia właśnie do użytkowników edytora wideo Flow, aplikacji Gemini oraz deweloperów korzystających z Vertex i Gemini API, to coś więcej niż tylko technologiczna ciekawostka. To strategiczny ruch, który ma umocnić pozycję Google w starciu z konkurencją i udowodnić, że firma potrafi nie tylko tworzyć potężne modele, ale też sprawnie wdrażać je do produktów używanych przez miliony.

Jakie są nowe możliwości Veo 3.1?

Największe wrażenie robią trzy kluczowe ulepszenia. Po pierwsze, Veo 3.1 generuje dźwięk do tworzonych klipów. To fundamentalna zmiana, ponieważ do tej pory większość modeli wideo skupiała się wyłącznie na obrazie, pozostawiając udźwiękowienie użytkownikowi. Google twierdzi, że AI potrafi dopasować audio do atmosfery i akcji na ekranie, co ma uczynić klipy “bardziej żywymi”. Na razie to proste dźwięki otoczenia, ale kierunek jest jasny – wideo ma być kompletne od A do Z.

Po drugie, wprowadzono zaawansowane funkcje edycyjne. Użytkownik może teraz wskazać obiekt i poprosić AI o dodanie go do istniejącej sceny. Co ważne, model automatycznie dopasowuje styl, oświetlenie i perspektywę dodanego elementu, by ten wtopił się w otoczenie. To trochę jak magia Photoshopa, ale w ruchomym obrazie. Na dokładkę Google zapowiada, że już wkrótce pojawi się funkcja usuwania obiektów. Znikające z filmu postaci czy przedmioty? Proszę bardzo. To otwiera pole do błyskawicznych korekt i manipulacji, które dotąd wymagały godzin pracy specjalisty.

Wreszcie, Veo 3.1 ma po prostu działać lepiej. Według Google model wierniej trzyma się poleceń (promptów) i generuje bardziej realistyczne, spójne stylistycznie klipy. Poprawiono też funkcję tworzenia wideo na podstawie pojedynczego zdjęcia, co ma być teraz bardziej płynne i wiarygodne.

Czym jest Google Flow i dlaczego 275 milionów to liczba, która przeraża?

Sercem strategii Google jest Flow – prosty w obsłudze edytor wideo, który od swojej premiery w maju stał się poligonem doświadczalnym dla technologii Veo. To właśnie tam trafiają najnowsze funkcje. I najwyraźniej użytkownicy to docenili. Firma pochwaliła się, że od maja za pomocą Flow stworzono ponad 275 milionów filmów. Ta liczba jest oszałamiająca i pokazuje, jak ogromny jest apetyt na łatwe w obsłudze narzędzia do tworzenia treści.

Jednocześnie budzi to pewien niepokój. Zalew generowanych przez AI, często niskiej jakości treści, to problem, z którym już dziś mierzą się media społecznościowe. Dostępność tak potężnego narzędzia dla każdego może tylko przyspieszyć ten proces. Z drugiej strony – demokratyzacja tworzenia to szansa dla małych firm, niezależnych artystów i edukatorów, którzy zyskują dostęp do technologii zarezerwowanej dotąd dla wielkich graczy.

Czy to początek końca tradycyjnej produkcji wideo?

Każda premiera tak zaawansowanego modelu AI prowokuje pytania o przyszłość branży kreatywnej. Wprawdzie Veo 3.1 wciąż nie zastąpi hollywoodzkiej ekipy filmowej, ale staje się coraz potężniejszym narzędziem w rękach twórców. Możliwość szybkiego generowania ujęć, dodawania lub usuwania elementów w postprodukcji czy tworzenia całych animacji na podstawie prostych komend to rewolucja w warsztacie pracy.

To także sygnał dla rynku. Firmy zajmujące się produkcją materiałów stockowych mogą czuć na plecach oddech sztucznej inteligencji, która na zawołanie wygeneruje dowolny klip. Marketerzy zyskują opcję tworzenia spersonalizowanych reklam wideo na masową skalę. Kto na tym zyska, a kto straci? Jak zwykle, odpowiedź nie jest prosta. Pomimo tego, jedno jest pewne – Google właśnie podniosło poprzeczkę i zmusiło całą branżę do jeszcze szybszego biegu. Wojna na generatory wideo rozkręca się na dobre.

Google prezentuje Veo 3.1. Nowy model AI generuje wideo z dźwiękiem i pozwala usuwać obiekty

Jakie są nowe możliwości Veo 3.1?

Czym jest Google Flow i dlaczego 275 milionów to liczba, która przeraża?

Czy to początek końca tradycyjnej produkcji wideo?

Aleksandra Wilk

Warto przeczytać też:

Pakistan idzie na całość. Milion ekspertów i tysiąc produktów – cały świat patrzy na ten plan

AI to nowy „klub dla chłopców”. Inwestorka Rana el Kaliouby bije na alarm

Rynek AI to bańka? MIT i Altman gaszą euforię. Giełdy reagują nerwowo

Myjesz naczynia, a oni płacą 80 dolarów. Tak wygląda dziś trening robotów

Polski język jednak nie jest najlepszy dla AI? Microsoft oficjalnie dementuje

7 godzin “myślenia” nad kodem. OpenAI pokazało bestię. Eksperci w szoku.