Google Gemini ma nową supermoc. Model Lyria 3 pozwala tworzyć muzykę z opisu tekstowego lub zdjęcia. W kilka sekund wygenerujesz 30-sekundowy utwór z wokalem.
W skrócie:
- Google wprowadziło do Gemini model Lyria 3, który generuje 30-sekundowe utwory muzyczne na podstawie opisów tekstowych, a nawet przesłanych zdjęć, wraz z okładką.
- Każdy utwór jest oznaczony niewidocznym znakiem wodnym SynthID, co ma chronić prawa autorskie i identyfikować treści stworzone przez sztuczną inteligencję.
- Nowa funkcja jest dostępna w wersji beta dla użytkowników powyżej 18. roku życia i wspiera obecnie osiem języków, w tym angielski, niemiecki oraz francuski.
Google po raz kolejny przesuwa granicę tego, co potrafi sztuczna inteligencja. Tym razem gigant z Mountain View bierze na warsztat branżę muzyczną. Do aplikacji Gemini trafia właśnie Lyria 3 – najnowszy model generatywny od Google DeepMind, który zamienia każdego z nas w kompozytora. Zapomnij o skomplikowanych programach do produkcji muzyki, drogim sprzęcie i latach nauki teorii. Wystarczy kilka słów lub jedno zdjęcie, by w parę chwil stworzyć coś, co brzmi jak profesjonalnie wyprodukowany utwór.
Jak Twoja wyobraźnia staje się studiem nagraniowym?
Proces jest niemal absurdalnie prosty. Użytkownik wpisuje w Gemini krótki opis, a system resztę robi sam. Chcesz skomponować komiczny utwór R&B o zagubionej skarpetce? Proszę bardzo. A może wolisz radosny kawałek w klimacie afrobeatu, który opowiada o niedzielnych obiadach u mamy? Lyria 3 dostarczy gotowy, 30-sekundowy klip. Co więcej, model sam napisze tekst piosenki, wygeneruje wokal i zaproponuje unikalną okładkę, stworzoną przez inny model – Nano Banana.
To nie jest proste generowanie melodyjki. Narzędzie daje ogromną kontrolę nad efektem końcowym. Można precyzyjnie określić styl, tempo, nastrój, a nawet rodzaj wokali – od soulowych ballad po hip-hopowe nawijki. Muzyka staje się formą osobistej ekspresji, dostępną od ręki. Gotowy utwór można natychmiast pobrać albo udostępnić znajomym za pomocą prostego linku. To narzędzie do tworzenia ścieżki dźwiękowej do własnego życia. I do wewnętrznych żartów, które w końcu mogą wybrzmieć na cały głos.
Czy to koniec artystów? Google uspokaja (i zabezpiecza)
Wprowadzenie tak potężnego narzędzia nieuchronnie budzi pytania o etykę i prawa autorskie. Google podchodzi do tematu – przynajmniej na razie – bardzo poważnie. Każdy wygenerowany utwór zostaje oznaczony przez SynthID. To technologia, która osadza w pliku audio niesłyszalny dla ludzkiego ucha znak wodny. Dzięki niemu zawsze będzie można zidentyfikować, że dany fragment muzyki stworzyła sztuczna inteligencja. To kluczowe zabezpieczenie w świecie, gdzie granica między twórczością ludzką a maszynową zaczyna się zacierać.
A co z naśladowaniem znanych artystów? System wyposażono w specjalne filtry. Jeśli w prompcie podasz nazwisko Taylor Swift czy The Weeknd, Gemini nie skopiuje ich stylu jeden do jednego. Zamiast tego potraktuje prośbę jako luźną inspirację gatunkową, co ma chronić artystów przed nieautoryzowanym wykorzystaniem ich wizerunku i unikalnego brzmienia. Wygląda na to, że Google chce uniknąć prawnych batalii, które stały się zmorą innych firm rozwijających generatywną AI.
Kto i kiedy zagra tę melodię? Dostępność i ograniczenia
Nowa funkcja jest obecnie wdrażana w fazie beta, co oznacza, że dostęp do niej jest jeszcze ograniczony. Na razie mogą z niej korzystać użytkownicy Gemini w wersji przeglądarkowej, a w najbliższych dniach trafi także do aplikacji mobilnych. Z narzędzia mogą korzystać wyłącznie osoby pełnoletnie.
Pomimo swojej wszechstronności, model Lyria 3 ma też swoje ograniczenia. Obecnie wspiera osiem języków, wśród których nie ma jeszcze polskiego. Można tworzyć po angielsku, niemiecku, hiszpańsku czy francusku. Użytkownicy płatnych planów – AI Plus, Pro oraz Ultra – otrzymają wyższe limity generowania audio, co sugeruje, że darmowa wersja będzie miała swoje limity. To standardowa strategia monetyzacji, która nikogo już nie dziwi. Pozostaje czekać, aż będziemy mogli stworzyć disco-polowy hit o smogu w Krakowie. Wtedy rewolucja dokona się naprawdę.