Meta Platforms (NASDAQ:META) heeft de meest uitgebreide versie van zijn Llama 3 kunstmatige intelligentie modellen gelanceerd, met verbeteringen in taalkundige capaciteiten en wiskundige probleemoplossing. Het bedrijf kondigde de lancering van het nieuwe AI-model aan, dat in acht verschillende talen kan communiceren, computercode van hogere kwaliteit kan produceren en complexere wiskundige problemen kan oplossen dan zijn voorgangers.
Het Llama 3 model, met zijn 405 miljard parameters, is een aanzienlijke verbetering ten opzichte van de vorige versie en maakt deel uit van Meta's strijd tegen betaalde rivaliserende modellen zoals OpenAI's GPT-4, met één biljoen parameters, en een aankomend model van Amazon met twee biljoen parameters.
In een strategische zet biedt Meta de Llama 3-modellen grotendeels gratis aan ontwikkelaars aan, wat volgens CEO Mark Zuckerberg innovatie zal bevorderen en de afhankelijkheid van concurrenten zal verminderen. Zuckerberg voorspelt dat het tegen het einde van het jaar de populairste AI-assistent zal zijn, die al door honderden miljoenen mensen wordt gebruikt.
De release benadrukt de race van de tech-industrie om de waarde van grote taalmodellen aan te tonen bij het aanpakken van complexe redeneeruitdagingen. Meta's top AI-wetenschapper heeft gesuggereerd dat, terwijl deze modellen nieuwe hoogten bereiken, alternatieve AI-systemen nodig kunnen zijn voor toekomstige doorbraken.
Naast het vlaggenschipmodel is Meta ook bezig met het updaten van de lichtere versies met 8 miljard en 70 miljard parameters. Deze modellen hebben nu een uitgebreid "contextvenster", waardoor ze grotere gebruikersverzoeken kunnen verwerken en meer informatie kunnen onthouden, wat vooral handig is bij het genereren van computercode.
Ahmad Al-Dahle, Meta's hoofd van generatieve AI, merkte het belang op van het grotere contextvenster, omdat dit de belangrijkste feedback was van de ontwikkelaarsgemeenschap. Zijn team verbeterde ook het vermogen van het Llama 3 model om wiskundige problemen op te lossen door AI-gegenereerde data te gebruiken voor training.
Ondanks de kosten, die door investeerders onder de loep zijn genomen, zou de strategie van Meta de bedrijfsmodellen van concurrenten kunnen verstoren als ontwikkelaars de voorkeur geven aan de gratis modellen. Het bedrijf heeft opgeschept over de prestaties van Llama 3 in benchmarks, met scores die wedijveren met of hoger zijn dan die van toonaangevende modellen zoals GPT-4o en Claude 3.5 Sonnet op reken- en kennistests.
Het Llama 3 model scoorde 73,8 op de MATH benchmark, vlak na GPT-4o's 76,6 en voor Claude 3.5 Sonnet's 71,1. Het behaalde ook 88,6 op de MATH benchmark. Het behaalde ook 88,6 op de MMLU benchmark, die verschillende onderwerpen omvat, bijna gelijk aan GPT-4o's 88,7 en iets beter dan Claude 3.5 Sonnet's 88,3.
Vooruitkijkend teasen Meta-onderzoekers de ontwikkeling van "multimodale" versies van de modellen, die beeld-, video- en spraakmogelijkheden zullen integreren naast de kernfuncties van tekst. Deze zullen naar verwachting concurrerend zijn met andere multimodale modellen zoals Google's Gemini 1.5 en Anthropic's Claude 3.5 Sonnet, en zullen later dit jaar worden uitgebracht.
Reuters heeft bijgedragen aan dit artikel.Dit artikel is vertaald met behulp van kunstmatige intelligentie. Raadpleeg voor meer informatie onze gebruiksvoorwaarden.