Xilinx verdubbelt Alveo HBM, voegt clustering toe voor HPC en big data-workloads
Op de SC21 supercomputing-conferentie deze week introduceerde Xilinx zijn Alveo U55C datacenter-acceleratorkaart en een nieuwe op standaarden gebaseerde, API-gestuurde clusteroplossing voor het op grote schaal inzetten van FPGA's. Het bedrijf zei dat door clustering van honderden Alveo-kaarten en programmeerbaarheid op hoog niveau van zowel de applicatie als het cluster mogelijk te maken, deze nieuwe kaart het opschalen van Alveo-rekenmogelijkheden om high-performance computing (HPC)-workloads aan te pakken, eenvoudiger en efficiënter dan voorheen maakt.
Xilinx zei dat de Alveo U55C-kaart speciaal is gebouwd voor HPC- en big data-workloads, en de hoogste rekendichtheid en HBM-capaciteit (geheugen met hoge bandbreedte) biedt in het Alveo-acceleratorportfolio. Samen met de nieuwe Xilinx RoCE v2-gebaseerde clusteringoplossing, kan een breed spectrum van klanten met grootschalige computerworkloads nu krachtige FPGA-gebaseerde HPC-clustering implementeren met behulp van hun bestaande datacenterinfrastructuur en netwerk. Architectonisch gezien beweert de op FPGA gebaseerde accelerator de hoogste prestaties te leveren tegen de laagste kosten voor veel rekenintensieve workloads. Het introduceert een op standaarden gebaseerde methodologie die het mogelijk maakt om Alveo HPC-clusters te creëren met behulp van de bestaande infrastructuur en het netwerk van een klant.
Het bedrijf zei dat dit een grote stap voorwaarts is voor een bredere acceptatie van Alveo en adaptive computing in het hele datacenter.
In een interview met embedded.com zei Nathan Chang, HPC-productmanager voor datacenters bij Xilinx:"We beginnen in te zien dat computergebruik niet altijd het knelpunt is. Eigenlijk is het vaker wel dan niet de geheugenbandbreedte. Steeds meer rekenproblemen worden aan geheugenbandbreedte gebonden. Dus hebben we onze kaart afgeslankt tot een enkele sleuf en ook de HBM op die kaart verdubbeld. Maar wat nog belangrijker is, we boden de mogelijkheid om uit te schalen over deze kaarten, met de mogelijkheid om grote clusters met honderden kaarten te creëren en alle HBM op die kaarten te targeten.”
Hij vervolgde:"Het ontsluiten van de bandbreedte over clusters van Alveo-kaarten is altijd een grote onderneming geweest voor onze gemeenschap. Ontwikkelaars moesten teams maken en vervolgens hun eigen clusterontwerpen maken om aan hun behoeften te voldoen. Nu komen we naar voren met een op open standaarden gebaseerd clusteringpakket, wat inhoudt dat we RoCE v2 en datacenterbridging zullen gebruiken, overal Ethernet met een bandbreedte van 200 Gbps in elke kaart.”
"Dit betekent dat u in de bestaande infrastructuur in datacenters deze kaarten in bestaande servers kunt plaatsen, ze kunt gebruiken op bestaande Ethernet-netwerken en kunt concurreren met InfiniBand op het gebied van prestaties en latentie."
“Een ander belangrijk punt is dat we niet alleen ruimte creëren voor grotere werklasten, maar dat we er ook voor zorgen dat Vitis toegankelijker wordt voor de ontwikkelingsgemeenschap. U hoeft niet langer RTL of Verilog te begrijpen. Je bent in staat om Alveo-kaarten te programmeren en Alveo-borden te targeten met bestaande talen op hoog niveau zoals C, C++ en Python.”
Alveo U55C-functies voor HPC en big data
De Alveo U55C-kaart combineert veel belangrijke functies die de huidige HPC-workloads vereisen. Het levert meer parallellisme van datapijplijnen, superieur geheugenbeheer, geoptimaliseerde gegevensbeweging door de pijplijn en de hoogste prestaties per watt in het Alveo-portfolio, aldus Xilinx. De kaart heeft een FHHL-vormfactor met één sleuf met volledige hoogte en halve lengte met een laag maximaal vermogen van 150 W. Het biedt een superieure rekendichtheid en verdubbelt de HBM2 tot 16 GB in vergelijking met zijn voorganger, de Alveo U280-kaart met twee sleuven. Daarom biedt de nieuwe U55C meer rekenkracht in een kleinere vormfactor voor het creëren van dichte op Alveo-versneller gebaseerde clusters. Dit is gericht op streaminggegevens met hoge dichtheid, hoge IO-wiskunde en grote rekenproblemen die moeten worden opgeschaald, zoals big data-analyse en AI-toepassingen.
Door gebruik te maken van RoCE v2 en datacenterbridging, gekoppeld aan 200 Gbps bandbreedte, maakt de API-gestuurde clusteringoplossing een Alveo-netwerk mogelijk dat concurreert met InfiniBand-netwerken in prestaties en latentie, zonder lock-in van leveranciers. MPI-integratie stelt HPC-ontwikkelaars in staat om Alveo-datapipelining uit te schalen van het Xilinx Vitis uniforme softwareplatform. Gebruikmakend van bestaande open standaarden en frameworks, zei het bedrijf dat het nu mogelijk is om uit te schalen over honderden Alveo-kaarten, ongeacht de serverplatforms en netwerkinfrastructuur en met gedeelde workloads en geheugen.
Softwareontwikkelaars en datawetenschappers kunnen profiteren van de voordelen van Alveo en adaptive computing door programmeerbaarheid op hoog niveau van zowel de applicatie als het cluster met behulp van het Vitis-platform. Xilinx zei dat het zwaar heeft geïnvesteerd in het Vitis-ontwikkelingsplatform en de toolsstroom om adaptive computing toegankelijker te maken voor softwareontwikkelaars en datawetenschappers zonder hardware-expertise. De belangrijkste AI-frameworks zoals Pytorch en Tensorflow worden ondersteund, evenals programmeertalen op hoog niveau zoals C, C++ en Python, waardoor ontwikkelaars domeinoplossingen kunnen bouwen met behulp van specifieke API's en bibliotheken, of Xilinx-softwareontwikkelingskits kunnen gebruiken om de belangrijkste HPC gemakkelijk te versnellen workloads binnen een bestaand datacenter.
Wie gebruikt de kaarten?
Chang zei dat het bedrijf met verschillende organisaties heeft gewerkt aan proof-of-concept-ontwerpen met behulp van de U55C-kaarten.
Een van hen is CSIRO, de nationale onderzoeksorganisatie van Australië, samen met 's werelds grootste antenne-array voor radioastronomie, die de U55C gebruikte in plaats van GPU's, omdat de Alveo-kaart een kaart met één slot mogelijk maakt en geen NIC (netwerkinterfacekaart) vereist. CSIRO gebruikt Alveo U55C-kaarten voor signaalverwerking in de vierkante kilometer array-radiotelescoop. Door de Alveo-kaarten in te zetten als aan het netwerk gekoppelde versnellers met HBM, is een enorme doorvoer op schaal mogelijk over het HPC-signaalverwerkingscluster. Het op Alveo-accelerator gebaseerde cluster stelt CSIRO in staat om de enorme rekentaak aan te pakken van het aggregeren, filteren, voorbereiden en verwerken van gegevens van 131.000 antennes in realtime. De 460 Gbps HBM2-bandbreedte over het signaalverwerkingscluster wordt bediend door 420 Alveo U55C-kaarten die volledig met elkaar zijn verbonden via P4-enabled 100 Gbps-switches. Het Alveo U55C-cluster levert verwerkingsprestaties met een totale doorvoer van 15 Tb/s in een compact vermogen en een kostenefficiënte footprint. CSIRO voltooit nu een voorbeeld van een Alveo-referentieontwerp om andere radioastronomie of aangrenzende industrieën te helpen hetzelfde succes te behalen.
Een ander gebruiksvoorbeeld is met Ansys LS-DYNA crashsimulatiesoftware, die door bijna elk autobedrijf ter wereld wordt gebruikt. Het ontwerp van veiligheids- en structurele systemen hangt af van de prestaties van modellen, aangezien ze de kosten van fysieke crashtests verminderen met computerondersteunde simulaties van eindige elementenmethodes (FEM). FEM-oplossers zijn de primaire algoritmen die simulaties aansturen met honderden miljoenen vrijheidsgraden. Deze enorme algoritmen kunnen worden opgesplitst in meer rudimentaire oplossers zoals PCG, Sparse matrices, ICCG. Door uit te schalen over veel Alveo-kaarten met hyperparallelle datapipelining, kan LS-DYNA de prestaties met meer dan 5x versnellen in vergelijking met x86-CPU's. Dit resulteert in meer werk per klokcyclus in een Alveo-pijplijn, waarbij LS-DYNA-klanten profiteren van spelveranderende simulatietijden. "In de geest van meedogenloze innovatie, zijn we enthousiast over de samenwerking met Xilinx om de eindige-elementenoplossers, die 90% van de rekenwerklast voor impliciete mechanica kunnen vertegenwoordigen, aanzienlijk te versnellen in onze LS-DYNA-simulatietoepassing", aldus Wim Slagter. , directeur strategische partnerschappen bij Ansys. "We kijken uit naar de versnelling van Xilinx die ons helpt bij onze missie om innovators te ondersteunen bij het ontwikkelen van wat ons te wachten staat."
Xilinx noemde een derde voorbeeld, dat van TigerGraph, een leverancier van een toonaangevend platform voor grafische analyse. Het bedrijf gebruikt meerdere Alveo U55C-kaarten om de twee meest productieve algoritmen te clusteren en te versnellen die op grafieken gebaseerde aanbevelingen en clustering-engines aansturen. Grafiekdatabases zijn een disruptief platform voor datawetenschappers. Grafieken halen gegevens uit silo's en leggen de nadruk op de relaties tussen gegevens. De volgende grens voor grafieken is om die antwoorden in realtime te vinden. Alveo U55C versnelt de querytijden en voorspellingen voor aanbevelingsengines van minuten tot milliseconden. Door gebruik te maken van meerdere U55C-kaarten om analyses op te schalen, versnelt de superieure rekenkracht en geheugenbandbreedte de grafische querysnelheden tot 45x sneller in vergelijking met CPU-gebaseerde clusters. De kwaliteit van de scores neemt ook toe met tot wel 35 procent, wat resulteert in een groter vertrouwen, waardoor valse positieven drastisch worden verlaagd tot lage enkele cijfers.
De Alveo U55C-kaart is momenteel beschikbaar op de website van Xilinx en via geautoriseerde Xilinx-distributeurs. Het is ook beschikbaar voor evaluatie via openbare cloudgebaseerde FPGA-as-a-service-providers, evenals geselecteerde colocatiedatacenters voor privévoorbeelden. Clustering is nu beschikbaar voor privévoorbeelden, en de algemene beschikbaarheid wordt verwacht in het tweede kwartaal van volgend jaar.
Ingebed
- Siemens voegt toe aan Veloce voor naadloze hardware-ondersteunde verificatie
- Big data omzetten in slimme data met ingebouwde AI
- TI:BAW-resonatortechnologie maakt de weg vrij voor communicatie van de volgende generatie
- DATA MODUL:nieuwe bindingstechnologie voor grootschalige projecten
- Cervoz:robuuste SSD van militaire kwaliteit voor missiekritieke toepassingen
- CEVA:tweede generatie AI-processor voor diepe neurale netwerkworkloads
- Kontron:nieuwe embedded computerstandaard COM HPC
- acceed:I/O-modules voor schaalbare datacommunicatie
- Vier grote uitdagingen voor het industriële Internet of Things
- Zal big data een oplossing bieden voor noodlijdende gezondheidsbudgetten?
- Big data versus kunstmatige intelligentie