Investing.com -- In de voortdurende race om generatieve kunstmatige intelligentie (AI) verder te ontwikkelen, heeft de Chinese startup DeepSeek stilletjes een nieuw gespecialiseerd AI-model als open source vrijgegeven, volgens een bericht van de South China Morning Post. Deze stap volgde slechts een dag nadat Alibaba de derde generatie van zijn Qwen-familie had gelanceerd.
De in Hangzhou gevestigde startup heeft zijn nieuwste open-source Prover-V2-model geüpload naar Hugging Face, ’s werelds grootste open-source AI-gemeenschap. Dit gebeurde zonder enige aankondiging op hun officiële sociale mediakanalen. De stap heeft de verwachtingen voor DeepSeeks aankomende R2-redeneermodel verhoogd.
De Prover-serie van DeepSeek bestaat uit domeinspecifieke modellen die zijn ontworpen om wiskundige problemen op te lossen. Het bedrijf heeft nog geen details over het nieuwe model op zijn Hugging Face-pagina gedeeld. Geüploade bestanden suggereren echter dat het is gebouwd op basis van DeepSeeks V3-model, dat 671 miljard parameters heeft en gebruikmaakt van een mixture-of-experts architectuur voor kostenefficiënte training en werking.
De ontwikkeling van een wiskundig gericht model heeft geleid tot speculatie dat DeepSeek binnenkort aanvullende modellen zal lanceren. Het bedrijf reageerde echter niet op een verzoek om commentaar hierover.
Dit artikel is vertaald met behulp van kunstmatige intelligentie. Raadpleeg voor meer informatie onze gebruiksvoorwaarden.