Nvidia har inngått et samarbeid med Arm, hvor formålet er å bringe maskinlæring og kunstig intelligens (AI) til forbrukerelektronikk og milliarder av IoT-enheter verden over. Samarbeidet ble annonsert under Nvidias GPU Technology Conference i San Jose, midt i hjertet av Silicon Valley.
I tillegg lanserte selskapet det de hevder skal være det største fremskrittet innenfor datagrafikk for grafiske arbeidsstasjoner på 15 år, samt en «deep learning»-server med en ytelse på 2 petaflops.
Nvidias åpen kildekode-plattform for maskinlæring skal integreres med Arms plattform
Samarbeidet mellom Nvidia og Arm går ut på at Nvidias åpne Deep Learning Accelerator (NVDLA) skal integreres med Arms kommende Project Trillium-plattform for kunstig intelligens i mobile enheter.
Arm og Nvidia har samarbeidet lenge, ettersom Nvidia har grafikkbrikker som er basert på Arm-arkitektur. Men nå utvides altså samarbeidet andre veien, noe som ifølge pressemeldingen fra de to selskapene skal gjøre det enkelt for selskaper som lager brikker for tingenes internett (IoT) å integrere kunstig intelligens i sine brikkedesign.
Deepu Talla, viseadministrerende direktør og sjef for «Autonomous Machines»-avdelingen hos Nvidia sier i pressemeldingen at det å trekke logiske slutninger – «inferencing» – vil bli en sentral egenskap for alle IoT-enheter i fremtiden.
– Aksellerasjon av AI i «kanten» av nettverkene er kritisk for å oppnå Arms visjon om å koble opp en billion IoT-enheter, sier Rene Haas, sjef for IP Group i Arm. – Vi er i dag ett skritt nærmere den visjonen ved å integrere NVDLA i Arm Project Trillum-plattformen, sier han.
NVDLA er en gratis og åpen arkitektur basert på Nvidia Xavier, en AI-systembrikke som brukes i blant annet selvkjørende biler. NVDLA-arkitekturen skal ifølge Nvidia fremme en standard måte å designe løsninger for aksellerasjon av maskinlæring. Den støttes av Nvidias utviklerverktøy for AI-løsninger – blant annet kommende versjoner av TensorRT, et verktøy og en «runtime» for maskinlæring og optimalisering av nevrale nettverk.
AI-superdatamaskinen DGX-2
Nvidia snakket ikke bare om kunstig intelligens i små duppeditter og IoT-enheter, men lanserte også DGX-2, som ifølge selskapet skal være den første enkeltstående serveren med en ytelse på to petaflops. En petaflop tilsvare én million milliarder, altså én billiard (1015) flyttallsoperasjoner per sekund.
DGX-2 skal være ti ganger raskere enn DGX-1, og inneholder 16 Tesla V100 GPU-er med 32 GB HBM2-minne hver – totalt 512 GB grafikkminne. Nvidias toppsjef Jensen Huang sammenlignet DGX-2 med en gigantisk GPU i sin presentasjon, selv om det egentlig er 16 GPU-er i én boks. Men de 16 GPU-ene er de første som benytter Nvidias nye NVSwitch-løsning, som gjør det mulig for alle GPU-ene å dele det samme minnet.
Ifølge Nvidia skal DGX-2 i ett kabinett levere like mye «deep learning»-prosesseringskraft som tilsvarende 300 tradisjonelle servere i 15 rack i et datasenter. Strømforbruket skal også være på bare rundt en 18.-del. Størrelsen på DGX-2 er ikke oppgitt, men ifølge rapporter i andre medier skal den være på størrelse med et minikjøleskap.
DGX-2 blir imidlertid ingen billig fornøyelse. Skulle du få lyst på en, må du ut med heftige 399.000 dollar – eller rundt 3 millioner kroner.
Lanserte nytt grafikkort for grafiske arbeidsstasjoner
En annen nyhet var Nvidia Quadro GV100, som ifølge produsenten skal være intet mindre enn det største fremskrittet innenfor datagrafikk på 15 år.
Det Nvidia mener med det, er at GV100 for første gang – via den nylanserte Nvidia RTX-teknologien – gjør det mulig med sanntids raytracing. Raytracing er en metode for å skape mer realistiske 3D-animasjoner og bilder, ved at man «sporer» hvordan lysstråler beveger seg og reflekteres fra ulike objekter. Dette kan brukes for å skape datagenererte bilder som ofte ikke kan skilles fra virkeligheten. Teknikken er mye brukt i filmproduksjon.
Nvidia RTX ble lansert på Game Developers Conference forrige uke, og kan brukes av utviklere via et nytt DirectX Raytracing-API fra Microsoft, samt via den kommende åpen kildekode-baserte grafikkstandarden Vulkan.
Quadro GV100 er basert på Nvidias Volta GPU-arkitektur, og kommer med 32 GB grafikkminne. Ytelsen er oppgitt til 7,4 TFLOPS dobbel-presisjon og 14,8 TFLOPS enkeltpresisjon, samt 118,5 TFLOPS for «deep learning». Kortet er beregnet på profesjonell bruk og kraftige grafiske arbeidsstasjoner. Prisen er ukjent, men forgjengeren – Quadro GP100 – selges for rundt 80.000 norske kroner.