Arcee AI Trinity: 400B model rzuca wyzwanie Llama 4

30-osobowy startup Arcee AI rzuca wyzwanie gigantom. Stworzyli Trinity – model AI o 400 mld parametrów, który ma być prawdziwie otwartą alternatywą dla Llama 4.

W skrócie:

Arcee AI, startup z 30 pracownikami, wypuścił Trinity – jeden z największych amerykańskich modeli open source o 400 miliardach parametrów.
Model ma konkurować z Llama 4 od Mety i jest udostępniony na licencji Apache, co gwarantuje jego stałą otwartość w przeciwieństwie do rozwiązań gigantów.
Wytrenowanie modelu zajęło 6 miesięcy i kosztowało 20 milionów dolarów, co stanowi ułamek budżetów, jakimi dysponują liderzy rynku sztucznej inteligencji.

W branży AI panuje ciche przekonanie, że karty zostały już rozdane. Rynek modeli fundamentalnych mieli zawłaszczyć technologiczni giganci – Google, Meta, Microsoft z przystawkami w postaci OpenAI i Anthropic. Reszta miała co najwyżej zbierać okruchy z pańskiego stołu. Ale wtedy na scenę wchodzi 30-osobowy startup Arcee AI i mówi: “potrzymajcie nam nasze red bulle”. Właśnie wypuścili Trinity, model o mocy 400 miliardów parametrów, który nie tylko rzuca wyzwanie najlepszym, ale robi to na warunkach, które Big Tech omija szerokim łukiem – w ramach prawdziwie otwartej licencji Apache.

Kto rzuca rękawicę Goliatom z Big Techu?

Arcee AI to nie jest kolejny garażowy projekt marzycieli. To zespół, który do tej pory zajmował się dostosowywaniem istniejących modeli open source dla dużych klientów korporacyjnych, takich jak SK Telecom. Jak przyznaje założyciel i CEO Mark McQuade, były pracownik Hugging Face, firma nie planowała tworzyć własnego laboratorium AI od zera. “Braliśmy świetną pracę innych: model Llama, model Mistral, model Qwen… i ulepszaliśmy go” – mówi McQuade. Szybko jednak okazało się, że uzależnienie od modeli tworzonych przez innych staje się problemem. Szczególnie gdy najlepsze otwarte alternatywy pochodziły z Chin, co budziło zrozumiałą nieufność amerykańskich przedsiębiorstw.

Decyzja o stworzeniu własnego, potężnego modelu od podstaw była, delikatnie mówiąc, nerwowa. “Myślę, że na świecie jest mniej niż 20 firm, które kiedykolwiek przetrenowały i wypuściły własny model” – podkreśla McQuade, mówiąc o skali, do której aspirowali. Zaczęli od małego, testowego modelu 4,5B, a sukces tego projektu ośmielił ich do podjęcia znacznie większego wyzwania.

Jak powstał model, który kosztował “tylko” 20 milionów dolarów?

Najbardziej zdumiewające w tej historii są liczby. Stworzenie Trinity od zera, na 2048 procesorach graficznych Nvidia Blackwell B300, zajęło zaledwie sześć miesięcy i pochłonęło 20 milionów dolarów. W świecie, gdzie liderzy wydają na trening miliardy, ta kwota brzmi jak budżet na kawę i ołówki. Lucas Atkins, CTO firmy, przyznaje, że dla nich to “dużo pieniędzy”, ale jednocześnie wie, że to nic w porównaniu z wydatkami konkurencji. Ten sześciomiesięczny sprint nie był przypadkiem.

“To było bardzo skalkulowane” – wyjaśnia Atkins. “Jesteśmy młodym, ekstremalnie głodnym startupem. Mamy ogromną pulę talentów i błyskotliwych młodych badaczy, którym zaufaliśmy, że gdy damy im szansę wydać tyle pieniędzy i wytrenować tak duży model, staną na wysokości zadania. I z pewnością to zrobili, kosztem wielu nieprzespanych nocy i długich godzin”. Te słowa to coś więcej niż korporacyjna gadka – to manifest zespołu, który chce udowodnić, że zwinność i determinacja mogą konkurować z niemal nieskończonymi zasobami.

Dlaczego “prawdziwie otwarty” model ma znaczenie?

Ktoś mógłby zapytać: po co kolejny otwarty model, skoro Stany Zjednoczone mają już Llama od Mety? Odpowiedź tkwi w licencji. Jak zauważa Atkins, Llama nie jest w pełni open source. “Można ją postrzegać jako nie do końca otwarte oprogramowanie, ponieważ korzysta z licencji kontrolowanej przez Metę, z zastrzeżeniami komercyjnymi i użytkowymi” – tłumaczy. To sprawia, że niektóre organizacje open source w ogóle nie uznają Llama za zgodną z ich standardami. Mark Zuckerberg zresztą sam sugerował, że jego firma nie zawsze będzie udostępniać swoje najbardziej zaawansowane modele.

Arcee AI idzie inną drogą, wybierając licencję Apache 2.0. To deklaracja ideologiczna. “Arcee istnieje, ponieważ USA potrzebują trwale otwartej, licencjonowanej przez Apache, alternatywy klasy ‘frontier’, która faktycznie może konkurować na dzisiejszym froncie” – mówi wprost McQuade. To sygnał dla deweloperów i naukowców: nasz model jest i zawsze będzie wasz, bez żadnych ukrytych warunków i korporacyjnych haczyków.

Co potrafi Trinity i dla kogo jest przeznaczony?

Na razie Trinity to potwór tekstowy. Został zoptymalizowany pod kątem kodowania i obsługi wieloetapowych procesów, co czyni go idealnym narzędziem dla agentów AI. Wstępne benchmarki pokazują, że w zadaniach związanych z matematyką, kodowaniem, wiedzą i zdroworozsądkowym rozumowaniem dotrzymuje kroku, a czasem nawet nieznacznie przewyższa Llama 4 Maverick 400B. To imponujący wynik, biorąc pod uwagę, że mówimy o wczesnej wersji modelu. W planach jest już wersja multimodalna, obsługująca obrazy (w fazie rozwoju) i mowę (dalsza perspektywa).

Model będzie dostępny za darmo do pobrania w trzech wariantach: Trinity Large Preview (lekko dostrojona wersja do ogólnych rozmów), Trinity Large Base (surowy model bazowy) oraz TrueBase (wersja bez żadnych danych instruktażowych, dla tych, którzy chcą go w pełni dostosować). Arcee AI planuje również zaoferować hostowaną wersję z konkurencyjnym cennikiem API. To sprytne połączenie idealizmu open source z pragmatyzmem biznesowym. Jak mówi Atkins: “aby zdobyć serca i umysły deweloperów, musisz dać im to, co najlepsze”. Wygląda na to, że właśnie podjęli pierwszą, bardzo poważną próbę.

30-osobowy startup rzuca wyzwanie Google i Meta. Ich model AI ma 400 mld parametrów!

Kto rzuca rękawicę Goliatom z Big Techu?

Jak powstał model, który kosztował “tylko” 20 milionów dolarów?

Dlaczego “prawdziwie otwarty” model ma znaczenie?

Co potrafi Trinity i dla kogo jest przeznaczony?

Piotr Szymański

Warto przeczytać też:

Zatruty łańcuch dostaw AI. Twój autonomiczny bot może pracować dla hakera

Twoja następna terapia? Z chatbotem. Nowy trend budzi skrajne emocje

Polski język jednak nie jest najlepszy dla AI? Microsoft oficjalnie dementuje

Rynek AI to bańka? MIT i Altman gaszą euforię. Giełdy reagują nerwowo

“Dom zawsze wygrywa”? AI rzuca wyzwanie bukmacherom. Kto za tym stoi?

Koniec z bezdusznym botem. ChatGPT zyskało osobowość, a ty nią sterujesz