NVIDIA představuje 7nm AMPERE grafickou sérii – pro výpočetní i herní nasazení v čele s GA100!

2020-05-15 09:19:51

vypnutá je jen 1/8 toho čipu

2020-05-15 10:23:32

A v jednom monolitu, kdy tedy 1/8 je vypnutá ... to je mazec ... to už je celkem dovaha zkoušet produkovat takové macky s plochou přes 800mm. V podstatě na limitu možností výroby.

2020-05-14 17:55:35

Citace:

Novinka je tedy jen maximálně o pouhých maximálně 24%(!) klasickým výkonem lepší, což je extrémně malý posun a zdaleka neodpovídá očekáváním po 3 letech čekání.

vypadá to že A100 je hlavně výrazně lepší v AI oproti V100 díky nové generaci Tensor jader i když počet jader je nižší, což by mělo u herních karet znamenat výrazně lepší výkon DLSS ale předpokládám že u herních karet budou vyšší boost frekvence a ne jen nějakých 1400 Mhz takže rozdíl ve výkonu oproti TITAN V bude vyšší než "jen" 24%

2020-05-14 18:30:03

jo hlavně má jen 6912 jednotek aktivních místo 8000 něco co to má ve skutečnosti, takže nějaký výkon tam ještě je ...

ale je to docela divný že tak nízký takt a tak hodně uzamčený, že by NV úplně nezvládala 7nm výrobu?

2020-05-14 20:24:04

To je snad TSMC kdo má výrobní linky na 7nm a nezvládá tu výrobu tak dobře jako tomu bylo u např.12nm ( kde bylo na V100 na Titan V vypnutých jen 256 jednotek pokud se nepletu i když boost clock byl také jen něco přes 1400 Mhz, až na Tesla V100 SXM2 Která vyšla koncem března 2018 byl těch 1533 Mhz jak je v tabulce a také Quadro GV100 kde byl boost 1627 Mhz a výkon v FP32 16,66 TFLOPS - tedy skoro 4 měsíce po tom co vyšel Titan V a výroba na tom byla asi už lépe a tak se bylo možné dostat na vyšší takty, to stejné se může stát se 7nm výrobou a koncem roku tu můžeme už mít karty které budou mít podobně velký čip jako A100 a na výrazně vyšších taktech a třeba i z větší části aktivní), když se Nvidia rozhodla 1/8 čipu uzamknout tak bych řekl že jich měli hodně né úplně 100%, resp. byla nízká výtěžnost ale třeba AMD nebo Intel udělá podobně velký čip na 7nm a pak budeme moci porovnávat kdo ho má z větší části aktivní nebo na vyšší frekvenci

QWERTY [Zobrazit profil] [Poslat zprávu]

2020-05-15 09:57:53

Je to prostě 54 miliard tranzistorů v jednom obřím monolitu, ta chybovost tam bude velká a chtít 100% čipy by znamenalo mít pár čipů z waferu ... navíc to prostě i přes 7nm proces vyrobí nějakého tepla ... až 400W z takové plochy, to je už celkem problém to odvádět. A pokud by ten čip byl aktivní celý, tak jsme kolem 460-470W, to už je slušné množství tepla na to, aby to efektivně proteklo přes 800mm čtverečních.
Ona ta vypnutá osmina čipu bude v podstatě sloužit pro lepší rozvod tepla, aby se to dalo uchladit.

2020-05-14 17:49:45

Som dosť prekvapený, že sa použili procesory Epyc. Aspoň je vidno, že v tej Nvidii nie sú až tak zakonzervovaný. Samozrejme je to výhoda pre tento výpočetný systém. Xeony boli prevdepodobne nedostačujúce. Epyc to je proste už iný level.

mittar [Zobrazit profil] [Poslat zprávu]

2020-05-14 17:58:03

Ja si myslim, ze treba je to protoze PCIE4, Epic je maji, Intel jeste ne, takze bych to s nadeji videl, ze i nVidia u Amperu bude mit PCIE4 minimalne.

Ganimoth [Zobrazit profil] [Poslat zprávu]

2020-05-14 20:39:35

Jo, proste potrebuji bandwith jako prase a jedina dalsi alternativa s pcie4 je PowerPC, takze volba je jasna

hor410 [Zobrazit profil] [Poslat zprávu]

2020-05-15 09:22:39

Na různých serverech se píše, že toto monstrum je vyráběné na "obyčejném" 7nm TSMC (N7), stejně jako Ryzeny a ne na vylepšené variantě N7P ani na N7+EUV. Jak to teda je?

2020-05-15 09:46:13

zjišťuji .....

2020-05-15 10:39:35

je to tak stačí se podívat na oficiální dev blog nvidia Odkaz

Citace:

Key features
Fabricated on the TSMC 7nm N7 manufacturing process, the NVIDIA Ampere architecture-based GA100 GPU that powers A100 includes 54.2 billion transistors with a die size of 826 mm2.

a také vyšší propustnost pamětí, ne "jen" 1134 GB/s jak je v té tabulce z videocardz ale 1555 GB/s a jde o HBM2, ne o HBM2e :

Citace:

40 GB HBM2 and 40 MB L2 cache
To feed its massive computational throughput, the NVIDIA A100 GPU has 40 GB of high-speed HBM2 memory with a class-leading 1555 GB/sec of memory bandwidth—a 73% increase compared to Tesla V100.

2020-05-15 09:52:04

Ono těch tensor cores je méně, ale nově toho umí podstatně více a jejich výkon je doslova neskutečný. V podstatě se to dá srovnat s dobou, kdy do x86 procesorů přišly SIMD instrukce. Aplikace optimalizované pro tensor cores v A100 budou dosahovat obrovského výkonu hodně daleko od toho, co dokáží poskytnout klasické stream procesory.

Pro příklad výkony v FP16 tensor, TF32 tensor a BF16 tensor se pohybují ve stovkách Tflops (až 624 Tflops v FP16 tensor), kdy těch 19,5 TFlops produkovaných klasickými stream procesory v FP32 nebo 78 Tflops v FP16 je najednou velice chabý výkon.

2020-05-15 10:09:11

jenže ono to umí jen někde, ve specifickém nasazení (AI) a za specifických podmínek .... sama NVIDIA přiznává že některé ty hodnoty ani v nejlepší praxi nenastanou ...

pokud se bavíme o AI nasazení, ano, ten výkon bude lepší, ale všude jinde ten nárůst výkonu u AMPERE proti VOLTA je velmi malý ....

2020-05-15 10:20:29

Tohle je ale čip jasně prezentovaný pro využití v rámci AI. Tam byl mířen veškerý nárůst výkonu. A100 je čip v podstatě navržen kompletně kolem nových tensor cores a tak nemá smysl jej využívat na aplikace, kde ty jednotky nevyužijete.
Typickým příkladem využití je aktuálně AI. To ale neznamená, že by se ty jednotky nedaly využít v jiným oborech. Doposud byly jejich možnosti značně omezené jen na FP16 tensor, nově toho umí podstatě víc. Zjednodušeně řečeno to nyní přes matice umí všechny základní počty FP XX, BF XX a INT X, které doposud jely přes stream procesory. Tedy těch možností nasazení se nyní může také najít podstatě více. Je to v podstatě dokonalá analogie na SIMD v procesorech.

2020-05-15 10:32:28

čip bude použit i u dalších karet a řešení ... nicméně prezentovaná verze "karet" je samozřejmě hlavně pro AI to je pravda ...

je samozřejmě otázkou, jak budou vypadat AMPERE GPU pro klasické herní grafiky, protože tohle AMPERE nemá podle NV ani RayTracing jednotky ;)

nicméně i tak není výsledné 7nm GA100 v současné podobě zrovna to, co jsme čekali a takový posun proti 12nm GV100 ... posun výkonu je velmi malý, nárůst TDP je vysoký, takty jsou nízko a čip je ještě z velké části zamčený ...

Dexter1 [Zobrazit profil] [Poslat zprávu]

2020-05-15 10:48:10

Podle mne to Nvidia od sebe hodně odsekne a herní GPU budou vypadat dost odlišně. Ono TCores v herní grafice tak nějak nebudou mít smysl, podobně jako RT jádra v čipu pro AI a proto tam ani nejsou.
Podle mne Nvidia pochopila, že to musí rozseknout, protože jinak by to bylo jen plýtvání křemíkem a herní GPU budou hodně odlišná. Jenom mne už tedy celkem "straší" ty počty texturovacích jednotek. Přeci jen pamatuji čipy, kde se daly spočítat na prstech jedné ruky

Ono z mého pohledu jsou TCores v herní grafice slepá větev, Nvidia se pomocí nich snažila vylepšit obraz, ale prakticky to nepřineslo pozitivní citelný efekt ve hrách a na jádře to jenom zabíralo haldu křemíku.
Podobně pak RT jednotky. Zajímavý nápad a obecně pokus jak RTX dostat pod "svoji" technologii a tak trochu ji uzamknout před AMD. Ale bohužel pro Nvidii, AMD ukázalo, že RTX jde bez problémů řešit přes stream procesory a navíc v nových konzolích bude zase APU od AMD, takže RTX na hrách pro konzole pojede přes stream procesory a otevřený standard, takže pro Nvidii tak nějak nemá smysl dál zkoušet protlačovat svoji technologii, když to všechny porty z konzolí budou řešit stejně jinak, její verze RTX by tak byla omezena jen na pár her a RT jádra by zase zabírala zbytečný křemík v jádře. To už je snad lepší ten prostor zaplnit klasickou kombinací jednotek, nebo ten prostor ušetřit a dostat z čipu vyšší frekvence.
Tedy pokud se bude Nvidia tvrdošíjně držet TCores a RT jednotek v herní GPU, tak může mít s novými grafikami AMD celkem problém.

2020-05-15 11:38:59

A zase ta dojmologie.

Nastuduj si co je DXR a RTX a co nvidia dělala nedělala. Nikdy netlačily žádnou svoji RT technologii a nikdo před nikým nic neuzavíral. To co tu píšeš jsou úplné bláboly.

Jistě, že se bude nvidia dál držet RT i Tensor jednotek.

renmou [Zobrazit profil] [Poslat zprávu]

2020-05-15 11:49:01

Tensor a RT jednotky tam určitě budou u Nvidia herních karet (jen tam asi nebude tolik těch FP64 jader oproti A100 kde jich je 32 na SM stejně jako v V100 ale TU102 má jen 2 FP64 na SM takže asi tak), stejně tak jako jsou Tensor a RT i v konzolových čipech pro PS5 a Xbox s. X od AMD a v dalších založených na RDNA 2 architektuře, potvrzuje to např. článek který vyšel na Eurogameru Odkaz kde byl rozhovor s Andrew Goossen z Mcrosoftu a říkal že by RT šlo i přes shadery ale spotřebovalo by to přes 13 TFLOPs takže na Series X to běží na dedikovaným hardwaru a ne přes shadery ...

Citace:

The ray tracing difference
RDNA 2 fully supports the latest DXR Tier 1.1 standard, and similar to the Turing RT core, it accelerates the creation of the so-called BVH structures required to accurately map ray traversal and intersections, tested against geometry. In short, in the same way that light 'bounces' in the real world, the hardware acceleration for ray tracing maps traversal and intersection of light at a rate of up to 380 billion intersections per second.

"Without hardware acceleration, this work could have been done in the shaders, but would have consumed over 13 TFLOPs alone," says Andrew Goossen. "For the Series X, this work is offloaded onto dedicated hardware and the shader can continue to run in parallel with full performance. In other words, Series X can effectively tap the equivalent of well over 25 TFLOPs of performance while ray tracing."

2020-05-15 13:29:45

Probůh už by to chtělo zastavit tady ty fikce. Nvidia nedělá z RT žádnou uzavřenou záležitost. RT je standard, o který se stará DXR. Nvidia jen přišla s vlastním HW, který ho bude počítat. Nikdo nikomu neřekl, že se to musí počítat přes jádra, která má Nvidia ve svých kartách. Nvidia jen přidala jádra, která to počítají rychleji než shadery. Takže AMD přijde se svým řešením. Buď to bude chtít počítat přes shadery, nebo si implementuje svůj HW na výpočet RT.

ReveNCZ [Zobrazit profil] [Poslat zprávu]

2020-05-15 10:24:41

no potom je taky otazka jestli se tyto gpu budou vubec pouzivat i k necemu jinymu nez AI, a kdyz jo tak kolik % tech karet takle vyuzito bude, dost mozna drtiva mensina..NV sama rika ze AI nasazeni melo top prioritu.