Skip to content Skip to sidebar Skip to footer

Giganci z Doliny Krzemowej rzucili 41 milionów dolarów na startup, który chce udźwiękowić AI. Koniec niemych filmów!

Niemiecki startup Mirelo zebrał 41 mln dolarów od gigantów VC, by rozwiązać problem niemych wideo z AI. Ich technologia automatycznie dodaje efekty dźwiękowe.

W skrócie:

  • Berlińskie Mirelo pozyskało 41 mln dolarów w rundzie seed. Inwestycji przewodzili giganci z Doliny Krzemowej – Index Ventures oraz Andreessen Horowitz (a16z).
  • Startup rozwija model AI, który analizuje treść wideo i automatycznie synchronizuje z nim profesjonalne efekty dźwiękowe (SFX), wypełniając krytyczną lukę na rynku.
  • Mirelo rzuca wyzwanie Sony, Tencentowi i ElevenLabs. Firma planuje potroić swój dziesięcioosobowy zespół i skupić się na budowie przewagi w niszowej dziedzinie audio AI.

Rewolucja wideo napędzana przez AI ma jeden, dosyć niezręczny problem – jest niema. Generatory obrazu tworzą coraz bardziej spektakularne klipy, ale wciąż brakuje im ścieżki dźwiękowej, która nadaje scenom życie. To trochę jak oglądanie kina niemego w erze Dolby Atmos. Tę ciszę postanowił przerwać berliński startup Mirelo, który właśnie zamknął rundę finansowania na 41 milionów dolarów. Pieniądze wyłożyli najwięksi gracze z Doliny Krzemowej, co pokazuje, że problem jest więcej niż realny.

Jak brzmi rewolucja warta 41 milionów dolarów?

Pieniądze płyną szerokim strumieniem tam, gdzie technologia kuleje. W tym przypadku inwestorzy – z Index VenturesAndreessen Horowitz na czele – postawili na firmę, która chce stać się specjalistą od udźwiękowienia ery AI. Zespół Mirelo, składający się z zaledwie dziesięciu osób, ma ambitne plany. Jak ujawnił w rozmowie z TechCrunch CEO i współzałożyciel CJ Simon-Gabriel, do końca przyszłego roku firma chce “podwoić, jeśli nie potroić” zatrudnienie. Nowi pracownicy zasilą działy R&D i strategii rynkowej.

Fundamentem jest model Mirelo SFX v1.5, który potrafi zinterpretować akcję na ekranie i dopasować do niej zsynchronizowane efekty dźwiękowe. To nie jest proste zadanie. Wymaga zrozumienia kontekstu, fizyki i nastroju sceny. Simon-Gabriel, cytując George’a Lucasa, przypomina, że “dźwięk to 50% filmowego doświadczenia”. I dodaje od siebie: “Jeśli już, to jest to niedopowiedzenie. Możesz wziąć te same obrazy, a dźwięk ukształtuje zupełnie inny nastrój”.

Kto da głos niemym filmom z AI?

Mirelo wchodzi na rynek, który nie jest pusty. Własne modele wideo-do-dźwięku wypuściły już takie potęgi jak SonyTencent. Swoje trzy grosze dorzuciły też chiński Kling AI oraz wspierany również przez a16z ElevenLabs. Nawet Google zorientowało się, że coś jest na rzeczy, i wyposażyło swój generator wideo Gemini w ścieżki dźwiękowe napędzane przez model Veo 3.1 od DeepMind. Konkurencja jest więc potężna.

Jaka jest zatem strategia niemieckiego startupu? Nader sprytna. Zamiast walczyć na wszystkich frontach, Mirelo skupia się na węższej specjalizacji – efektach dźwiękowych (SFX). Simon-Gabriel twierdzi, że w tej dziedzinie prowadzonych jest mniej badań, co ułatwia zbudowanie realnej przewagi konkurencyjnej. “Łatwiej jest zbudować tutaj prawdziwą fosę, a następnie ją skapitalizować” – zauważa. Ten plan najwyraźniej przekonał inwestorów, bo łączna kwota zebranych przez firmę środków urosła do 44 milionów dolarów. Model biznesowy opiera się na dostępie do API oraz rozwijanej platformie Mirelo Studio. Plan dla twórców w modelu freemium ma kosztować około 20 euro miesięcznie, co jasno wskazuje na grupę docelową: amatorów i prosumentów.

Czy artyści muszą się bać? Prawnicy już zacierają ręce

Każda dyskusja o generatywnej AI nieuchronnie prowadzi do pytania o dane treningowe i prawa autorskie. Mirelo, świadome ryzyka, stara się grać w otwarte karty. Georgia Stevenson z Index Ventures zapewnia, że modele startupu trenowano na publicznych i zakupionych bibliotekach dźwięków. Co więcej, firma finalizuje umowy o podziale przychodów, które mają szanować prawa artystów. To podejście może okazać się kluczowe w budowaniu zaufania.

Wiarygodności dodaje fakt, że założyciele – CJ Simon-Gabriel i Florian Wenzel – są nie tylko badaczami AI, ale również muzykami. Na mapie drogowej firmy znajduje się generowanie muzyki, jednak na razie priorytetem pozostają efekty dźwiękowe. Startup wspierają też aniołowie biznesu z samego serca branży, w tym CEO Mistrala Arthur Mensch oraz dyrektor naukowy Hugging Face, Thomas Wolf. Wygląda na to, że Mirelo ma wszystko, czego potrzeba do sukcesu: pieniądze, technologię i odpowiednich ludzi na pokładzie. Simon-Gabriel podsumowuje to z rozbrajającą szczerością: “Nagle ludzie zdają sobie sprawę: ‘Och, może powinniśmy dodać dźwięk’. Oczywiście, że powinniście. To trochę jak nieme filmy kontra filmy dźwiękowe, prawda? To robi sporą różnicę!”. Trudno się z nim nie zgodzić.