Amazon (NASDAQ:AMZN) Web Services (AWS) heeft de introductie aangekondigd van nieuwe datacentrum-servers uitgerust met zijn eigen kunstmatige intelligentie (AI) chips, waarmee het de dominantie van Nvidia (NASDAQ:NVDA) in de sector uitdaagt. Apple Inc (NASDAQ:AAPL). is bevestigd als klant en is van plan deze nieuwe Trainium2-chips te gebruiken. De cloudafdeling van AWS onthulde dat deze servers deel zullen uitmaken van een enorme supercomputer, die honderdduizenden chips zal bevatten. Deze aankondiging werd dinsdag gedaan.
Deze supercomputer, aangedreven door AWS's Trainium2-chips, zal worden gebruikt door AI-startup Anthropic als eerste bedrijf dat deze technologie toepast. Anthropic staat bekend om het creëren van betrouwbare en interpreteerbare AI-systemen en zal het rekenvermogen benutten om de mogelijkheden van hun AI-modellen te verbeteren.
Benoit Dupin, een executive bij Apple, erkende ook dat de techgigant Trainium2-chips gebruikt, wat een significante adoptie van AWS's nieuwe aanbod betekent.
Matt Garman, AWS Chief Executive, onthulde verder dat het bedrijf al werkt aan Trainium3, de volgende evolutie van hun AI-chip, die volgend jaar zijn debuut zal maken.
De nieuwe Amazon Elastic Compute Cloud (Amazon EC2) instanties, aangedreven door AWS Trainium2, zijn nu algemeen beschikbaar en introduceren de Trn2 UltraServers. Deze UltraServers zijn ontworpen om uitzonderlijke prestaties en kostenefficiëntie te bieden voor het trainen en implementeren van hedendaagse AI-modellen, waaronder grote taalmodellen (LLM) en foundation models (FM).
De Trn2-instanties beloven een verbetering van 30-40% in prijs-prestatieverhouding ten opzichte van huidige GPU-gebaseerde EC2-instanties en beschikken over 16 Trainium2-chips, die 20,8 piek petaflops aan rekenkracht leveren. Dit maakt ze ideaal voor het verwerken van AI-workloads met miljarden parameters.
Voor nog veeleisendere AI-taken bieden de Trn2 UltraServers een nieuwe EC2-service, met 64 onderling verbonden Trainium2-chips voor maximaal 83,2 piek petaflops aan rekenkracht. Deze opstelling verviervoudigt de reken-, geheugen- en netwerkmogelijkheden van een enkele instantie, waardoor het mogelijk wordt om 's werelds grootste AI-modellen te trainen en te implementeren.
Het samenwerkingsproject tussen AWS en Anthropic, genaamd Project Rainier, heeft als doel een EC2 UltraCluster van Trn2 UltraServers te bouwen, die eenmaal voltooid 's werelds grootste AI-rekencluster zal worden.
AWS benadrukte ook de aankomende Trainium3-chip, die zal worden vervaardigd met behulp van een 3-nanometer procesnode, wat belooft de prestaties van de huidige Trn2 UltraServers te verviervoudigen.
De AWS Neuron software development kit (SDK) faciliteert de optimalisatie van AI-modellen om op Trainium-chips te draaien, ondersteunt populaire frameworks zoals JAX en PyTorch, en is geïntegreerd met de Hugging Face model hub, die meer dan 100.000 modellen host.
Trn2-instanties zijn momenteel beschikbaar in de AWS-regio US East (Ohio), met plannen om de beschikbaarheid binnenkort uit te breiden naar aanvullende regio's. Ondertussen worden de Trn2 UltraServers aangeboden in een preview-fase.
Dit artikel is vertaald met behulp van kunstmatige intelligentie. Raadpleeg voor meer informatie onze gebruiksvoorwaarden.