Google wprowadza do Gemini model Lyria 3. Ta rewolucja w AI pozwala tworzyć muzykę z tekstu lub zdjęcia, generując wokal, tekst i unikalną okładkę w sekundy.
W skrócie:
- Nowy model Lyria 3 w Gemini pozwala tworzyć 30-sekundowe utwory na podstawie opisów tekstowych lub zdjęć, automatycznie generując do nich tekst piosenki.
- Każdy utwór jest oznaczany niewidocznym znakiem wodnym SynthID, co ma chronić prawa autorskie i zapewnić identyfikację treści stworzonych przez AI.
- Funkcja jest obecnie dostępna w wersji beta dla użytkowników powyżej 18. roku życia, a wkrótce trafi do aplikacji mobilnych z limitami dla subskrybentów.
Zapomnij o drogim sprzęcie, latach nauki w szkole muzycznej i skomplikowanych programach do edycji dźwięku. Google właśnie postanowiło wręczyć klucze do studia nagraniowego każdemu, kto ma smartfona i pomysł. Do aplikacji Gemini trafia bowiem Lyria 3 – najnowszy model generatywny od Google DeepMind, który zamienia tekstowe polecenia w gotowe do publikacji utwory muzyczne. I to jakie.
To nie jest kolejne narzędzie do tworzenia prostych melodyjek w tle. Mówimy o pełnoprawnych, 30-sekundowych kompozycjach, które mają strukturę, wokal i – co najważniejsze – duszę. Wystarczy kilka słów, by powołać do życia utwór, który jeszcze chwilę temu istniał tylko w naszej wyobraźni. Cały proces jest absurdalnie prosty, a efekty potrafią zaskoczyć.
Jak Twoja wyobraźnia zamienia się w piosenkę R&B?
Mechanizm działania jest intuicyjny do bólu. Użytkownik wpisuje w Gemini krótki opis, na przykład „komiczny utwór R&B o zagubionej skarpetce”, a sztuczna inteligencja bierze się do pracy. Lyria 3 analizuje polecenie, dobiera styl, tempo, instrumenty, a nawet generuje pasujący do klimatu tekst piosenki. Nie musisz być poetą ani kompozytorem. Twoja rola sprowadza się do bycia dyrygentem własnych pomysłów.
Możliwości są praktycznie nieograniczone. Radosny kawałek w klimacie afrobeatu o niedzielnym obiedzie u mamy? Proszę bardzo. Elektroniczny utwór o porannej kawie? Nie ma problemu. Co więcej, na dokładkę system tworzy unikalną okładkę dla każdego singla, za którą odpowiada model graficzny Nano Banana. Gotowy klip można błyskawicznie pobrać lub udostępnić znajomym za pomocą linku. Tworzenie muzyki staje się więc nową formą osobistej ekspresji – szybkiej, dostępnej i diabelnie wciągającej.
Czy AI może być artystą? Google stawia na etykę
Wprowadzenie tak potężnego narzędzia rodzi oczywiste pytania o prawa autorskie i potencjalne nadużycia. Google zdaje się być tego świadome i od samego początku wdraża mechanizmy zabezpieczające. Najważniejszym z nich jest SynthID – technologia, która osadza w każdym wygenerowanym pliku audio niedostrzegalny dla ludzkiego ucha znak wodny. Pozwala on jednoznacznie zidentyfikować utwór jako dzieło sztucznej inteligencji.
System wyposażono również w filtry, które mają uniemożliwić bezpośrednie naśladowanie konkretnych artystów. Jeśli w prompcie podamy nazwisko znanej gwiazdy, Gemini nie skopiuje jej stylu jeden do jednego. Potraktuje to jedynie jako szeroką inspirację stylistyczną, dbając o to, by nie naruszyć niczyjej własności intelektualnej. To mądry ruch, który pokazuje, że firma chce uniknąć prawnych batalii, jakie stały się udziałem innych graczy na rynku generatywnej AI. Technologia ma być narzędziem kreatywnym, a nie maszyną do plagiatów.
Kto i kiedy stworzy swój pierwszy hit?
Nowa funkcja jest już wdrażana, na razie w fazie beta i w wersji przeglądarkowej Gemini. W najbliższych dniach trafi także do aplikacji mobilnych. Jest jednak kilka warunków. Przede wszystkim – dostęp mają wyłącznie użytkownicy, którzy ukończyli 18 lat. Ponadto model obecnie wspiera osiem języków, w tym angielski, niemiecki, hiszpański i francuski (na polski przyjdzie nam jeszcze poczekać).
Google wyraźnie pozycjonuje tę nowość jako funkcję premium. Choć każdy będzie mógł ją przetestować, wyższe limity generowania utworów otrzymają subskrybenci płatnych planów AI Plus, Pro oraz Ultra. Czy to początek nowej ery w przemyśle muzycznym? Z pewnością jest to krok, którego nie da się zignorować. Narzędzie, które pozwala w kilka sekund stworzyć chwytliwy podkład do rolki na Instagramie lub osobistą piosenkę na urodziny przyjaciela, ma gigantyczny potencjał. A my przyglądamy się temu z zapartym tchem.