Nový AMD RADEON Instinct MI100 je prý absolutní výpočetní bestie. 42 TFLOPS v FP32!!!?
Napsal Jan "DD" Stach   
Čtvrtek, 30 červenec 2020
altJak víte, AMD oddělilo výpočetní a herní grafiky, tedy CDNA a RDNA architektury. A tohle je výsledek.

 

 

 

 

MI100 s čipem ARCTURUS je nástupce VEGA pro výpočetní segment a speciálně HPC nasazení. Staví na zbrusu nové CDNA architektuře, která se od herní a spotřební RDNA v běžných Radeon grafikách, liší dost významně. Údajně vůbec nemá grafické pipeline, protože to vlastně není grafická karta, ale výpočetní karta. Nejde tedy ve stopách VEGA, co by univerzálního GPU. Naopak, vše je úzce zaměřeno na posílení výpočetních komplexních schopností HPC a serverové platformy v kombinaci s procesory AMD EPYC.

Vše je tak postaveno kolem možnosti škálování více GPU v systému, superrychlých sběrnicích Infinity Fabric atd. Samozřejmě MI100 bude fungovat i v serverech s XEON procesory, nicméně hlavní důraz je kladen na EPYC platformu, co by celek.

GPU by mělo mít 120 výpočetních jednotek (cca 7680SP) a k tomu minimálně 32GB HBM2 ECC pamětí s propustností 1,2TB/s. Samozřejmě karty mají PCIe 4.0 a Infinity Fabric sběrnici ke spojení až 8 GPU v jednom systému na jednu desku. Celková spotřeba jedné karty je stále solidních 300W, což je na první pohled sice hodně, ale efektivita je prý úžasná. Spekulace totiž mluví o tom, že karta má ohromujících 42TFLOPS klasického FP32 výkonu! A ne, nejde o žádné speciální případy, jako třeba u NVIDIA, která u svého A100 uvádí stovky TFLOPS, které ovšem karta dosahuje ve velmi speciálně optimalizovaných případech a speciálních aplikacích za velmi speciálních okolností.

Právě těch 42TFLOPS FP32 budí pochybnosti, protože to je naprosto šíleně vysoké číslo. Současný nejlepší Radeon MI50 s 32GB HBM a 7nm VEGA GPU má totiž „pouze“ 13,3 TFLOPS v FP32! Nedávno vydaná nová generace NVIDIA s obřím 7nm AMPERE A100, disponuje 19,5TFLOPS. A AMD teď najednou přijde a nabídne 3,1x více než má jeho stará generace a více než 2x více než nejnovější NVIDIA? To by bylo prostě neuvěřitelné. Samozřejmě je jasné, že bude hodně záležet na konkrétním nasazení. NVIDIA své akcelerátory právě přesně míří na speciální CUDA a AI aplikace a dá se samozřejmě očekávat to samé od AMD a jeho MI100, které možná bude o něco univerzálnější než AMPERE právě díky obecně vysokému FP32 výkonu. V případě AMD jde nicméně o to, že dokáže nabídnout vyladěnou a propojenou HPC platformu jako celek, což NVIDIA vůbec a Intel zatím, nabídnout nedokáží.

Každopádně vypadá to na masivní skok u AMD proti současnému VEGA řešení. První zákazníci se přitom dočkají už tento rok, kdy si samozřejmě AMD nenechá ujít příležitost ukázat a uvést nový Radeon MI100 v kombinaci s novými 7nm+ EPYC ZEN 3 procesory. Výsledkem bude platforma, která dokáže nabídnout 2x 64jádrový EPYC procesor a 8x MI100 RADEON v jediném serverovém racku s výkonem a efektivitou, na kterou bude koukat jakékoli existující i připravované řešení kombinující Intel s NVIDIA z hodně velké a uctivé vzdálenosti. Už tedy pomalu začíná být jasné, proč si hned na několik projektů vůbec nejvýkonnějších superpočítačů na světě v poslední době, vybrali prakticky všichni AMD EYPC CPU v kombinaci s AMD CDNA GPU. Radeon ARCTURUS MI100 je přitom jen první generace CDNA, takže to nejlepší nás teprve čeká. Vypadá to tedy, že optimismus akcionářů a AMD ohledně dalšího růstu společnosti má reálné základy v odpovídající kvalitě a schopnostech produktů.

Samozřejmě pro nás PC nadšence nejsou tyhle produkty přímo určené, ačkoliv je velmi pravděpodobně budeme „nevědomky“ používat v rámci růstných CLOUDových a internetových služeb. Není ale bez zajímavosti, že právě HPC a datacentra dnes táhnout a platí ten extrémně nákladný vývoj CPU i GPU technologií. Určitě z toho tedy budeme těžit i v rámci běžných procesorů RYZEN a grafik Radeon, kdy před námi je uvedení ZEN 3 RYZEN procesorů a RDNA 2 (NAVI 2) grafik, kdy se po mnoha letech dočkáme velkého high end čipu. Proto je ale HPC a serverový segment tak důležitý, protože herní produkty by vlastní vývoj RYZEN a NAVI samotné zaplatit nedokázaly.

Zatímco nás třeba stojí 32jádrový RYZEN pouze 55 tisíc, 64jádrový RYZEN jen 110 tisíc, serverové TOP verze s jinak fyzicky stejnými čipy, vychází klidně na dvojnásobek. A až si budete stěžovat na to, že výkonná herní grafika stojí 20 tisíc, tak vezte že výpočetní/profi verze s tím samým čipem vychází klidně na 100 tisíc i víc. Je tedy naprosto zásadní, aby AMD mělo v nabídce a tlačilo vývoj HPC EPYC a RADEON Instinct produktů, protože jedním z důvodů, proč jsme ještě před pár lety neměli na trhu žádné pořádné high end herní procesory a grafiky od AMD, byla právě absence pořádných HPC CPU a GPU produktů v jeho nabídce. Tam jsou prostě ty největší marže a obří zisky, které z velké části pak platí naše „hračky“ a herní super high end CPU a GPU.

 

 

AUTOR: Jan "DD" Stach
Radši dělám věci pomaleji a pořádně, než rychle a špatně.

Starší články


Komentáře
Přidat Nový
fotoba [Zobrazit profil] [Poslat zprávu] 2020-07-30 16:58:53

Citace:
MI100 s čipem ARCTURUS je nástupce VEGA pro výpočetní segment a speciálně HPC nasazení. Staví na zbrusu nové CDNA architektuře,




nie nutne novej len možno s jednoduchšou podporou SW ako GCN, ktorá bude až o 1-2 mesiace hotová

An Early Port Of GCC To AMD's GCN Architecture
on 22 September 2016
Odkaz

Porting GCC to AMD GCN microarchitecture
Honza Hubička SuSE ČR s.r.o Prague
Joint work with Martin Jambor
GNU Cauldron 2016


AMD Graphics Core Next
New and clean instruction set used by AMD GPUsFirst specification released in 2011,

...
Similar to traditional CPUs (unlike the predecessors)
Odkaz


LLVM 11 Merges AMD Radeon GCN Offloading For OpenMP
27 May 2020


This patch does come via AMD's Radeon Open Compute team. Hopefully we'll see more of the AOMP changes working their way back upstream in time for the LLVM 11.0 release due out around September.
Odkaz
Pemora [Zobrazit profil] [Poslat zprávu] 2020-07-30 21:26:28
avatar
Mne ten vykon nejak nesedi a tiez to vidim skor na specialne ulohy ako u NV lebo 42tflop fp32 pri danych CU je takt cez 2700mhz. Ved aj fp64 vykon ma 'len' 9.5tflop cize v teoretickych poctoch 19tflop fp32.

Mozno to riesia ako nv a pri podporovanom hw a sw daju 42tflop. NV udava pri vyuziti tensor 156tflop.

Alebo ide jednoducho o preklep a nieco tam proste chyba co by vysvetlilo 42tflop.
Pemora [Zobrazit profil] [Poslat zprávu] 2020-07-30 21:56:44
avatar
Dalej ma zaujima velkost takehoto gpu. Asi to bude min 650mm2 co uz je riadny macek. Mozno je vykon 42tflop pre 2gpu cez IF a vykon fp64 ma len 1:4 a nie 1:2.

Bude to zaujimavy rok...
snajprik [Zobrazit profil] [Poslat zprávu] 2020-07-31 07:48:21

Su to serveri tak že s nas to asi ťažko niekto využije či A100 alebo MI100, ale zaujala ma ta technologia prepojenia GPU, hlavne ta rychlosť komunikacii GPU medzi sebou 2x CPU 8x GPU a to všetko na jednej matičnej doske.
Lebo nejak Crosfire či SLi zanika, ale nieje to zly sposob navyšenia grafickeho vykonu.
xind [Zobrazit profil] [Poslat zprávu] 2020-07-31 09:47:29
avatar
jediné využití tohoto je analýza obrovského množství dat, dost to budoou asi využívat internetové firmy i stát.. to se máme na co tešit, s internetem to jde z kopce
Dexter1 [Zobrazit profil] [Poslat zprávu] 2020-07-31 11:00:59
avatar
Celé to je kachna. Ty původní slidy vypadají jako by je někdo namaloval v MS paintu Dokonce tam ani neodstranil bílá pozadí v písmenech jako O nebo B atd. prostě amatéřina nejhrubšího kalibru.
snajprik [Zobrazit profil] [Poslat zprávu] 2020-07-31 12:01:21

Vieš že to nieje oficialne vyhlasenie AMD. Ale ani fake to nieje, AMD prve informacie o tejto profi vypočetnej karte zverejnilo už v roku 2018. čip ma skutočne až 8192 SP cores ale počita sa s chybami preto ma 7680SP. Do predaja ma prisť v poslednom kvartali tochto roka, tak že unik informacii nieje nahodny.
Dexter1 [Zobrazit profil] [Poslat zprávu] 2020-07-31 12:18:13
avatar
No to je sice moc hezké, ale zatímco ostatní karty na těch slidech mají normální text tak zrovna ta pasáž kde se píše o výkonu v FP32 je udělaná fotošopem a to ještě dost špatně a okatě. (ten screen tu v článku není).
snajprik [Zobrazit profil] [Poslat zprávu] 2020-07-31 17:07:32

Začiatkom roka o tejto vypočetnej karte pisali že
pri 1GHz papkala 200W a vykon 25Tflops FP32.
pri 1,33GHz mala žrať 300W a vykon 34Tflops FP32
Od v tedy prešiel pol rok, možno zvlada vyšiu frekvenciu pri rovnakej spotrebe, alebo sa niekto len hral v powerpointe.
Jedine čo je iste že tato karta pride na trh a o jej vykone vieme tak isto ako o ostatnych novinkach, proste len dohady +- autobus
Nexon [Zobrazit profil] [Poslat zprávu] 2020-07-31 12:41:24

Tenhle hype jenom poškozuje AMD. Lepší je čekat méně a dostat více než naopak, 42 Tflops(fp32) považuji za nesmysl.
shipo [Zobrazit profil] [Poslat zprávu] 2020-08-01 21:32:25

42TFlops je nesmysl,
kdyby to bylo fp16 tak OK (snad to není nějaký v přesnosti ošizený fp32)
joyster1787 [Zobrazit profil] [Poslat zprávu] - RDNA2 podobný výkon ako RTX 30 2020-08-01 10:41:55

DD čo si myslíš o nových únikoch ktoré hovoria ,že najvýkonejšia RDNA2 karta od AMD bude cca o 15% výkonješia ako RTX 2080Ti a teda ,že bude mať podobný výkon ako RTX 3080 ? Ja viem ,že je to asi offtopic otázka ale aj tak by ma zaujímal tvoj názor dík .
snajprik [Zobrazit profil] [Poslat zprávu] 2020-08-02 07:28:16

Neviem čo si o tom mysli DD, osobne netušim vykon novej RDNA2, ešte ju nik oficialne netestoval, aj ked su fami že by to mohol biť narast až 110% nad 5700 ale to su len dohady.
čo viem že to bude podobne ako s 5700 ale 2x
Terajšia
RX5700XT ma 2560SP 25% pomalšia ako 2080Ti
RX5700 ma 2304SP 30% pomalšia ako 2080Ti
RX5600XT ma 2304 len 6GB 35% pomalšia ako 2080Ti
https://cdn.mos.cms.futurecdn.net/TugHhpjPzHsazC83Jktud5-2520-80.png

Netušim označenia AMD ale dajme tomu takto, lenže ktora karta s tichto troch by mala mať ako že o 15% nad 2080Ti?
RX6900 ma 5120SP a 16-32GB HBM2
RX6800 ma 4608SP a 12-16GB DDR6
RX6700 ma 4608SP a 8-12GB DDR6

2080Ti s 4300SP 11GB DDR6
3080 s 4300SP 12GB DDR6 vyšie takty čo by mali vykon navyšiť o 20% nad 2080Ti
3080Ti 5300SP tu sa hovori o 40% nad 2080Ti
Odpoved na tuto otaku vraj nieje daleko
Varin [Zobrazit profil] [Poslat zprávu] 2020-08-02 08:56:19

RX 5700XT je v pruměru o 40% slabší jak RTX 2080Ti.
Samotné zdvojnásobení jednotek většinou nepřináší 100% výkonu.
Když zůstaneme skromní, tak bez optimalizací nové architektury by RDNA1 s tímto navýšením jednotek měla mít výkon 20% nad RTX 2080Ti (+60%). Otázka je efektivita RDNA2 a tam se ukáže o kolik bude RX 6900 výkonější.

Těch 15-20% nad RTX 2080Ti je hodně skromných co tu někteří píšou. Bez optimalizací nové architektury by tomu tak mohlo být, ale vylepšená architektura...
Pemora [Zobrazit profil] [Poslat zprávu] 2020-08-02 09:09:32
avatar
No 25per je extrémny pripad a nerozumiem preco je uvadzany ako priemer vykon. Taky isty extrém je aj opacne a su hry kde je rozdiel vykone 60per....

V priemere je to 40per.

Kazdopadne 6900xt bude urcite vykonejsia od 2080ti o viac ako 15per. Moj odhad je 30per
joyster1787 [Zobrazit profil] [Poslat zprávu] 2020-08-02 10:35:54

Bodaj by si pravdu mal . To je môj najtajneší sen ale snažím sa byť pri zemi
snajprik [Zobrazit profil] [Poslat zprávu] 2020-08-02 18:02:18

Dosť prezradza odhadovana cena kariet.
3070 550 dolarov
3080 799 dolarov
3090 1699 dolarov
6900 999 dolarov mala by mať cca o 80% vyšši vykon ako 5700XT
https://www.techpowerup.com/gpu-specs/radeon-rx-6900-xt.c3481
Už len podla ceny sa da sudiť že AMD bude vykonejšia ako 3080 ale nie až tak ako 3090
PS: aby som nezabudol na intel GPU ako na prvi pokus nie zle https://www.techpowerup.com/gpu-specs/xe-arctic-sound.c3503
joyster1787 [Zobrazit profil] [Poslat zprávu] 2020-08-02 11:16:19

V tom článku čo som čítal sa píše o tom ,že najvýkonnejšia AMD karta by mala byť cca 15% nad RTX 2080Ti aj to v hrách optimalizovaných pre AMD. A teda +- niekde na úrovni novej RTX 3080. Ako jasné stále sú to fámy a tieto vraj vychádzajú z prezentácií GPU produktov ich partnerom.Sú to však stále špekulácie.Len ma tak zaujímalo či niečo viac nevie DD a či z neho nevytiahnem niečo viac Tak ale asi oddychuje cez víkend,zaslúžene no. A dík ,že ste sa zapojili viacerí do diskusie Mimochodom ak by sa to aj potvrdilo ,že najvýkonnejšia karta od AMD +- tých 15% nad RTX 2080 a teda +- úroveň RTX 3080 aj keby 10% pod ,tak pre mňa by ten výkon bol stále zaujímavý a atraktívny. Samozrejme viem si predstaviť agresívnejšiu cenu AMD napríklad do 699euro/18 296,33 CZK ,prípadne 100eur/2 617,50 CZK pod RTX 3080. V takomto prípade by ma tá karta seriózne zaujímala. RTX 3080 pravdepodobne pod 799eur/20 913,83 CZK nepôjde,skôr si myslím ,že buchnú ceny riadne hore u tej 3080 tipujem kľudne aj 899eur/23 531,33 CZK a možno viac len prvý nástrel cien. Neskutočne sa teším na predstavenie nových GPU ako od Nvidie tak od AMD ako malý chlapec .Určite budem čakať na AMD ako to dopadne a potom sa rozhodnem. Ale ako píšem ak to AMD zvládne s tou najvýkonnejšou kartou nad cca 15% RTX 2080 a neprestrelia cenu tak budem mať v bedni zas AMD A za mňa by to bol stále úspech konkurovať aspoň RTX 3080. Stále sa jedná o High end a veľmi výkonné GPU. Ceny RTX 3080Ti/3090 budú určite zas intergalaktické a pre drvivú väčšinu PC hráčov príliš veľký rozmar vďaka cene...
joyster1787 [Zobrazit profil] [Poslat zprávu] 2020-08-02 10:21:34

Sorry za román
ender [Zobrazit profil] [Poslat zprávu] 2020-08-02 07:40:10

Je to pravda, tu je článok
https://www.tomsguide.com/news/amd-big-navi-performance-leaked-and-its-good-news-for-nvidia-rtx-3080-ti dokonca tých 15% je v tituloch optimalizovaných pre AMD karty - v priemere to bude este menej.
snajprik [Zobrazit profil] [Poslat zprávu] 2020-08-02 19:54:42

Furt ale zabudaš povedať pre ktory čip, lebo AMD planuje ich 3
AMD Navi 21 (505mm2) 110% nad 5700
AMD Navi 22 (340mm2) 60% nad 5700
AMD Navi 23 (240mm2) 20% nad 5700

Tiež si myslim že Navi 23 na 2080Ti nebude mať a cca 10-20% vykonu jej bude chybať
Ak naražaš na Navi 22 tak to by už mala biť o cca 15% nad 2080Ti
Ale žeby plne odomknuty čip Navi 21 bol len o 15% vykonejši ako 2080Ti to by musel bežať na 1-1,2GHz
Problem by bol jedine keby AMD sa rozhodlo že nevyda Navi21 a by vydalo len Navi 22 to by fakt na 3080 nestačilo vykonom a len o cca 15% by prekonalo 2080Ti.
Nechce sa mi veriť žeby AMD proti Nvidii nevitiahlo svoj hlavny čip s 4600-5100SP ale len Navi 22 s 3200-3500SP.
OnGameOff [Zobrazit profil] [Poslat zprávu] - "hračky" 2020-08-02 08:02:33

Kdyby se jim ty naše "hračky" za 20 tisíc nevyplatilo prodávat, tak by to AMD ani nVidia určitě nedělali.
Pouze registrovaní uživatelé mohou přidat komentář!