Dow sluit drie Europese fabrieken; 800 banen getroffen
Investing.com -- Alibaba heeft de Qwen3-Embedding en Qwen3-Reranker serie gelanceerd, die nieuwe maatstaven zet in meertalige tekstverwerking en relevantierangschikking. De serie, die modellen bevat voor tekstembedding, informatie-ophaling en herrangschikking, ondersteunt 119 talen en is beschikbaar in versies van 0,6 mld., 4 mld. en 8 mld. parameters.
De Qwen3-Embedding en Qwen3-Reranker serie zijn gebouwd op het Qwen3-basismodel, dat beschikt over robuuste meertalige tekstbegripsmogelijkheden. Deze nieuwe modellen hebben toonaangevende prestaties behaald in verschillende benchmarks voor tekstembedding en herrangschikkingstaken. Ze zijn open source beschikbaar onder de Apache 2.0-licentie op Hugging Face, GitHub en ModelScope, en kunnen via API worden gebruikt op Alibaba Cloud.
De Qwen3-Embedding serie biedt verschillende formaten voor zowel embedding- als herrangschikkingsmodellen, geschikt voor diverse toepassingen waar efficiëntie en effectiviteit voorop staan. Het embedding-model van 8 mld. parameters staat vanaf 5 juni 2025 op nummer 1 in de MTEB meertalige ranglijst met een score van 70,58. De herrangschikkingsmodellen excelleren in tekstophalingscenario’s en verbeteren de zoekresultaten aanzienlijk.
De Qwen3-Embedding serie ondersteunt meer dan 100 talen, waaronder verschillende programmeertalen, en biedt robuuste meertalige, cross-linguale en code-ophalingsmogelijkheden. De modellen zijn ontworpen met dual-encoder en cross-encoder architecturen en zijn erop gericht om de tekstbegripsmogelijkheden van het basismodel volledig te behouden en te verbeteren.
Het trainingsraamwerk voor de Qwen3-Embedding serie volgt het meerfasentrainingsparadigma dat is opgezet door de GTE-Qwen serie. Dit omvat een drietrapsstructuur voor het Embedding-model en direct gebruik van hoogwaardige gelabelde data voor begeleide training van het Reranking-model, wat de trainingsefficiëntie verbetert.
Als onderdeel van toekomstige ontwikkelingen is Alibaba van plan het Qwen-basismodel verder te optimaliseren om de trainingsefficiëntie van tekstembeddings en herrangschikkingsmodellen te verbeteren. Dit zal de implementatieprestaties in verschillende scenario’s verbeteren. Daarnaast is het bedrijf van plan om zijn multimodale representatiesysteem uit te breiden om cross-modale semantische begripsmogelijkheden te ontwikkelen.
Dit artikel is vertaald met behulp van kunstmatige intelligentie. Raadpleeg voor meer informatie onze gebruiksvoorwaarden.