Divi jaunie Llama 4 modeļi

7. aprīlis, 2025

Meta apgalvo, ka jaunie Llama 4 MI modeļi ir pārāki par OpenAI un Google radītajiem ‘plašā mērogā’ funkciju.

Meta ir atklājuši Llama 4, jaunāko mākslīgā intelekta (MI) modeļu kolekciju, kas nu darbina Meta AI tīmekļa un lietotņu asistentu. Viens no tiem ir Scout, kas ir mazs, bet spēj ‘ietilpt vienā Nvidia H100 GPU”. Taču otrs ir Maverick, kas vairāk atgādina GPT-4o un Gemini 2.0 Flash. Mācību procesā vēl ir Behemoth, ko Marks Zakerbergs dēvē par “pasaulē augstākās veiktspējas bāzes modeli.”

Atsaucoties uz Meta, Scout ir 10 milj. tokenu konteksta logs (MI modeļa darba atmiņa). Tas pārspēj Google Gemma 3 un Gemini 2.0 Flash-Lite modeļus, kā arī atvērtā koda Mistral 3.1 “plašā spektrā zināmu punktu”. Līdzīgus apgalvojumus Meta izsaka par Maverick modeļa veiktspēju, salīdzinot to ar OpenAI GPT-4o un Gemini 2.0 Flash. Jaunā modeļa rezultāti kodēšanā un spriešanā ir salīdzināmi ar DeepSeek-V3, izmantojot “mazāk kā pusi aktīvo parametru”.

Tajā pat laikā Llama 4 Behemoth ir 288 miljardu aktīvo parametru ar 2 triljonu parametru kopā. Lai arī tas nav izlaists, Meta apgalvo, ka šis modelis spēj darīt vairāk kā sāncenši “dažādos STEM kritērijos”. Runa ir par GPT-4.5 un Claude Sonnet 3.7.

Par modeli vispārīgi – Meta ir pārslēgušies uz “ekspertu maisījuma” (MoE) arhitektūru. Ar šādu pieeju modelis taupa resursus, izmantojot tikai uzdevumam nepieciešamās daļas. Uzņēmums plāno apspriest MI modeļu un produktu nākotni LlamaCon konferencē, kas norisināsies 29. aprīlī.

Gluži kā ar iepriekšējiem modeļiem, Meta dēvē Llama 4 kolekciju “atvērtā koda”, lai gan modelis ir ticis kritizēts par licences ierobežojumiem. Piemēram, MI modeļa licence pieprasa, ka komerciālās vienības ar vairāk kā 700 milj. ikmēneša aktīvo lietotāju lūdz Meta atļauju pirms modeļa izmantošanas. Taču, apskatot 2023. gadā izveidoto Open Source Initiative, tas to izņem laukā no ‘Open Source’ kategorijas.

Avots: TheVerge