NVIDIA AMPERE – nová generace GPU zatím trochu zaostává za očekáváním? Co herní verze? |
Napsal Jan "DD" Stach | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Neděle, 17 květen 2020 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
zatím trochu zaostává za očekáváním? Co herní verze? Přesně 3 roky od nástupu 12nm VOLTA V100, přichází nová generace v podobě 7nm AMPERE A100. A zatím není ve všech ohledech zdaleka takovým pokrokem, jak se od nové generace po 3 letech čekalo. Jedno pozitivní překvapení doplňuje několik méně pozitivních. Je ovšem nutné zdůraznit, že herní verze AMPERE (kdy NVIDIA už oficiálně potvrdila, že architektura bude tentokrát stejná pro TESLA i GTX/RTX karty), budou přeci jen trochu jinak řešené. A100 řešení je speciálně orientované pro AI výpočty a strojové učení. Tam NVIDIA směřovala vylepšení a nárůsty výkonu (kdy mluví o násobcích, zatímco klasický výkon GPU se ve skutečnosti posunul jen o 24%). To ovšem neznamená, že by GA100 nebylo možné použít na normální grafickou kartu. Je to stále vlastně „normální“ GPU.
NVIDIA se dlouho vyjadřovala proti 7nm výrobě. Speciálně proti 7nm od TSMC. Proč a jaké to mělo následky, jsme se nedávno dozvěděli:
Společnost totiž ani nepočítala s TSMC, co by primárním partnerem pro výrobu nové generace GPU. Nezajistila si včas ani potřebné výrobní kapacity. Myslela si, že SAMSUNG přesvědčí ke spolupráci, a hlavně lepším cenám. Jenže to se nestalo a tlak na TSMC také nevyšel. NVIDIA tak 7nm GPU uvádí na trh až teď v polovině roku 2020, kdy AMD s TSMC začaly vyrábět 7nm GPU téměř před 2 lety, v druhé polovině roku 2018. NVIDIA jednoduše nemá zdaleka tak velké zkušenosti se 7nm výrobou, a stále jí vadí i vysoká cena výroba proti její optimalizované 12nm TSMC výrobě. Obojí se projevilo u první AMPERE a bude téměř určitě projevovat i nadále. GA100 čip není takový, jaký se očekával. Začněme tím pozitivnějším. Je překvapivě mnohem větší. Většina zdrojů počítala sice s velkými rozměry nad 600mm2, ale nikdo neuváděl, že by bylo větší, než 12nm obří VOLTA (815mm2). Jenže je, a má tedy rekordních 826mm2, což jsme na 7nm ještě neviděli. Ukazuje to, že možnosti 7nm výroby TSMC už první generace, jsou opravdu mnohem dál, než jsme si mysleli. Mimochodem, to že jde o první generace 7nm výroby a nikoliv tu EUV, je také překvapení. Největší 7nm GPU, které na trhu dosud bylo na trhu, a které je ale technicky už právě 2 roky staré, je AMD VEGA 20 (Radeon VII a Instinct série) s „pouhými“ 331mm2. AMD přitom pro Microsoft Xbox X vyrobila už více než 400mm2 velké SoC (8jádrový ZEN2 + NAVI 2), ale tohle zatím není na trhu a určitě nebude zdaleka tak drahé. Překvapivě, NVIDIA zvolila starší verzi 7nm výroby (nikoliv tedy novější 7nm EUV) a její čip je tedy 2,5x větší než dosud největší 7nm grafické jádro na trhu, 2 roky stará VEGA 20, současně má vyšší hustotu tranzistorů a to 65 milionů na 1mm2 proti 40milionům, To ovšem vytvořilo několik zjevných praktických problémů. NVIDIA zvolila starší verzi 7nm výroby kvůli ceně. 7nm EUV je totiž ještě výrazně dražší a výtěžnost takto velkého čipu bude v každém případě tragická. Bavíme se o několika málo čipech na 1 waffer, který stojí dnes mnoho tisíc dolarů, což bude znamenat astronomickou cenu výsledných čipů. GA100 bylo představeno na špičkové A100 „kartě“ s aktivními 6912 jednotkami a 5120-bit sběrnicí. A tady máme první méně pozitivní aspekt novinky. Čip má ve skutečnosti v sobě 8192 jednotek a 6144-bit sběrnici. Takže u A100 verze je osmina čipu deaktivovaná, což je nezvykle mnoho, speciálně u TOP verze produktu (už jen dle označení A100). Důvodem je zkrátka výtěžnost. Nutno říci, že těch 8192 jednotek u GA100 se očekávalo, a tady tak byly už velmi staré úniky správné. A existuje testovací plně aktivní verze, ovšem jednoduše uvést ji teď na trh, kvůli výtěžnosti není možné. 12nm VOLTA V100 má jen 5120 jednotek a 4096-bit sběrnici, ale i tak dosahuje výkonu 15,7TFLOPS. Očekávalo se, že vzhledem k tříletému odstupu a 7nm výrobě, nová AMPERE bude v klasickém výkonu alespoň 2x lepší. Jenže zdaleka není. A100 v představené verzi opravdu hodně zaostalo za očekáváním, kdy s 6912 jednotkami má nakonec „jen“ 19,5 TFLOPS výkonu. To je sice nárůst, a velmi vysoký výkon, ale jen o 24%, což je jeden z nejmenších mezigeneračních nárůstů. Speciálně když si uvědomíme ty 3 dlouhé roky odstupu. Celé řešení má navíc velmi vysokou spotřebu a TDP je ohromných 400W proti 250-300W u předchůdce. Zde samozřejmě hraje roli fakt, že GA100 jádro má neuvěřitelných 54 miliard tranzistorů, zatímco 12nm VOLTA „jen“ 21,1 miliardy. V tomhle ohledu efektivita a technologie tedy špatná není. Ale ta hustota, která je tedy ještě vyšší než u 2 roky starého VEGA řešení, se někde musela projevit. Prostě tahle enormní hustota komplikuje fungování čipu, chlazení, napájení atd. A100 má tak nečekaně nízké takty (což je alarmující vzhledem k tomu, že už tak má 400W TDP). Běží totiž jen 1410MHz v boostu, zatímco 12nm VOLTA měla až 1600MHz. Těch 1410MHz je opravdu hodně nízko, speciálně na finální 7nm produkt. A100 má navíc širší sběrnici a mnohem lepší paměti s celkovou propustnosti 1134GB/s. Kdyby bylo 7nm GA100 jádro plně aktivní, tedy s 8192 jednotkami na těch 1410MHz, dosahovala by karta výkonu zhruba 23,1 TFLOPS. Tedy to už by byl generačně zajímavější a standardnější 47% nárůst výkonu proti VOLTA. Jestli by to ovšem spolu s větší pamětí znamenalo brutální 500W TDP či více, to je těžké odhadovat. Je asi jasné, proč se NVIDIA moc nechlubí těmi běžnými hodnotami výkonu, a radši mluví o svém „tensor“ výkonu, které ve speciální AI případech a aplikacích může nastat, a kde je novinka opravdu násobně lepší, než VOLTA. NVIDIA ale sama přiznává, že její 370 TFLOPS v nejlepším případě v praxi nejspíše nenastane. Nicméně je jasné, proč je novinka orientována hlavně pro AI a trénování umělé inteligence. Jako klasické GPU je to sice jasně nové nejvýkonnější samostatné GPU, ale od TOP modelu nové generace AMPERE se očekávalo přeci jen více, zejména vzhledem k dlouhému 3letému odstupu a 7nm výrobě. 24% nárůst výkonu není prostě příliš zajímavý k prezentaci. A i když by evidentně GPU dokázalo nabídnout o pár desítky % více výkonu, nelze to rozumně vyrábět, ani napájet a chladit. Co to znamená pro herní AMPERE grafiky? Zatím nelze dělat závěry …
Zde bych ale rád zastavil a zdůraznil pro všechny, že je velmi těžké odvozovat od představeného extrémního GA100 čipu a jeho evidentních hraničních problémů s výrobní efektivitou a provozními vlastnostmi, jaké budou herní AMPERE grafiky. Tedy čipy GA102/104/107/106 a další, které NVIDIA chystá pro běžné herní, ale i profesionální grafické karty. 826mm2 obří GA100 čip, totiž na klasické herní grafice s velkou pravděpodobností neuvidíme. Pokud tedy NVIDIA nebude potřebovat každé % výkonu. S jeho nasazením by to ale bylo komplikované, protože výsledná karta by se nemohla honosit názvem RTX. NVIDIA totiž u něj vypustila překvapivě RT jednotky pro RayTracing akceleraci! A vydávat v roce 2020/2021 TOP výkonnou herní grafiku bez akcelerace RayTracingu, by bylo poněkud podivné. Je ale samozřejmě možné, že se objeví nějaký „TITAN A“. Každopádně 400W nová AMPERE A100 „grafika“ je pořád hodně výkonné řešení. Není sice nejvýkonnější na trhu (tohle prvenství stále přísluší Radeon PRO DUO II, duální VEGA 20 karta do jednoho slotu s výkonem ohromujících 28,3 TFLOPS. Tomu by nestačila ani plně aktivní A100). Bavíme se ale i tak o cca 25% výkonu nad TITAN V, tedy velmi zhruba nějakých až 40% nad RTX 2080 Ti. Plně aktivní GPU by dokázalo být klidně až o 60% výkonnější. S případně ještě vyššími takty a TDP překračujícím 500W+, určitě ještě výkonnější. Je samozřejmě otázkou, zda by se to na dnes běžných boost taktech u 12nm RTX modelů, tedy až kolem 1900MHz, dalo nějak rozumně chladit. Takže v potenciálním výkonu AMPERE zjevně problém není. Výkon tam je, jenže jak ten výkon z toho dostat a použitelně nabídnout? NVIDIA musí najít balanc, mezi velikostí čipu, cenou a výkonem, takty a spotřebou. GA102 jádro pro RTX 3080 Ti, tedy bude určitě menší na GA100. Ale nemuselo by být o moc menší (že by těch spekulovaných 600mm2?). Bude mít kolem 5000 výpočetních jednotek a takty snad přes 2GHz v boostu. Výkon karty by měl být údajně přes 20TFLOPS. Jen trochu nevěřím těm udávaným 200W TDP. Pokud to bude na stejné verzi výrobního procesu a s méně efektivními GDDR6, tak to těch 400W bude mít taky. Ale nevím, jen se divím, že by ta efektivita v rámci stejné architektury, byla tak výrazně odlišná. Ve finále by ale GA102 pro RTX 3080 Ti mohla mít podobný herní výkon, jako právě A100 orientované na AI a bez RT. GA102 bude mít méně Tensor ale bude mít RT a vyšší takty? Tedy alespoň 40% nad RTX 2080 Ti? Právě to je poslední údaj, který jsem slyšel z věrohodnějších zdrojů. Tedy že NVIDIA cílí v současnosti na minimálně 40% nárůst klasického výkonu ve hrách proti RTX 2080 Ti u RTX 3080 Ti, ale možná to bude moci vytáhnout až na 50 či dokonce 60%. Tady bude hodně záležet na tom, zda bude muset. Rozdíl několika % totiž může znamenat mnoho desítek W spotřeby. Karta ovšem nebude prý spoléhat na drahé, ale velmi efektivní a výkonné HBM paměti, ale jen lacinější GDDR6 a 384-bit sběrnici. Je ale prakticky nemožné odvozovat něco přesného pro GA102 z představené GA100. Kromě toho, že bude mít stejnou grafickou architekturu a tensor jádra, vše ostatní bude jiné. Už jen proto, že čip bude určitě menší, tak bude mít lepší výtěžnost, lepší provozní vlastnosti a snad tedy vyšší takty bez nutnosti mrazícího zařízení. Proč na tom záleží?
NVIDIA každopádně bude se 7nm bojovat, protože tento výrobní proces evidentně podcenila a velmi podcenila spolupráci TSMC a AMD. U AMD navíc nevíme o nových čipech prakticky vůbec nic. Spekuluje se o 505mm2 velkém RDNA2 čipu, což je ovšem 7nm+ EUV výroba. To by znamenalo ekvivalent téměř 600mm2 na té výchozí 7nm výrobě, jakou je vyráběno i nové AMPERE GA100 (současné i NAVI 10 atd.). Tedy rozhodně to nebude žádné ořezávátko. NVIDIA vůbec není nadšena z toho, co AMD RDNA2 předvádí v nových Xbox X a PS5 konzolích, kdy se evidentně AMD podařilo opravdu zásadně zlepšit efektivitu architektury a GPU a žádné z těchto GPU přitom nemá ani zdaleka velikost 505mm2 a už tak je výkon evidentně hodně vysoko. U NV existuje reálná obava, že NVIDIA bude v souboji 7nm generaci minimálně provozní efektivitou zaostávat. Speciálně když bude muset hnát svá GPU výše na taktech. Zde už může velké AMPERE GA100 napovídat. Není totiž ani jisté, že herní AMPERE budou vyrábět tím lepším 7nm procesem u TSMC (EUV), kterým ovšem budou vyráběna RDNA 2 NAVI 2 jádra AMD. Zatím to vypadá, že NVIDIA hraje na cenu, kdy 7nm výroba bez EUV je levnější. Ovšem svou zásadní roli může hrát i fakt, že jednoduše jiné výrobní kapacita, než právě starší verze 7nm, dostupné u TSMC pro NVIDIA letos prostě nebyla. To teprve uvidíme. Osobně si myslím, na základě toho, co mě bylo řečeno některými zdroji, že můžeme počítat se slušným nárůstem výkonu u AMPERE grafik, kdy ale spíše, než klasický bude zajímavější ten RT výkon, který by mohl poskočit konečně na použitelnou úroveň (údajně díky vylepšení tensor jader i více než dvojnásobně). Jenže výkon je jen jedna z věcí. Jak říkám, AMPERE ten výkonový potenciál zjevně má, ovšem zda jej bude možné použitelně nabídnout s rozumnými výrobními a provozními vlastnostmi, je zjevně otázku. NVIDIA ovšem podle průmyslových zdrojů rozhodně není tak klidná a optimistická, jako před vydáním RTX 2000 série. Což ani nemůže být. Situace se velmi změnila. AMD zjevně opravilo nedostatky svých grafik. RDNA 2 z toho málo co víme, vypadá velmi působivě. NAVI 2 není VEGA. NAVI 2 je herní GPU bude přímo v herních konzolích, což bude obrovská výhoda pro AMD. VEGA byla univerzální nouzovka. AMD se ovšem daří skvěle držet věci pod pokličkou, takže NVIDIA prostě neví, co přesně má od nové série konkurence čekat. A to je zásadní, protože neví, jak má nasadit takty, a tedy vyladit finální karty. Zda bude moci držet takty nízko, a tedy mít slušnou efektivitu, nebo bude potřebovat vytáhnout z těch čipů absolutní maximum, což pošle efektivitu do háje a současně ovlivní, jak kvalitní čipy bude potřebovat a kolik jich takových vůbec bude moci mít a také za kolik je bude moci na kartách nabídnout. U současné generace grafik se NVIDIA vůbec nemusela ohlížet na AMD, což je vidět u zaostávajících RTX 2060, které už konkurenci ze strany NAVI mají a ta je prostě lepší. Ale u nové generace se NVIDIA ohlížet bude muset, protože konkurenci dostane i TOP model. AMD navíc chystá konkurenci i pro výpočetní A100 přímo. A už s ní vyhrála i některé zakázky pro nejvýkonnější počítače světa, což naznačuje, že by na tom AMD nemuselo být s velkým výpočetním CDNA GPU špatně. A vůbec špatně nevypadá ani RDNA 2 co by herní řešení, zejména se vší tou podporou a asistencí ze strany SONY a Microsoft. Tohle tady ještě prostě nebylo. AMD také těží z úzké spolupráce s TSMC a toho, že speciálně 7nm EUV výroba byla na něj optimalizována od začátku, stejně tak RDNA 2 architektura pro ni. A několikaleté zkušenosti AMD se 7nm se také zákonitě projeví. Navíc, AMD nemá na grafickém trhu, co ztratit, takže bude určitě agresivní. To znamená HBM paměti (které navíc samo spolu-vyvinulo) i u některých herních grafik a firma se nebojí ani případného referenčního AiO chlazení u TOP modelu, pokud to přinese zajímavý výkon atd. Nicméně vše nasvědčuje tomu, že ho možná nebude potřebovat, protože RDNA 2 má být výrazně efektivnější a současně i reference budou mít axiální ventilátory. Na finálním vyladění taktů karet samotných, tedy bude hodně záležet a NVIDIA by potřebovala vědět, co AMD má a chystá. Ke zklamání mnohých tak šéf NVIDIA na GTC vůbec o herních AMPERE kartách nemluvil, protože jednoduše není připraven odhalit, co má v ruce a s čím pracuje. Samozřejmě AMD také kalkuluje a bude nastavovat některé finální specifikace podle toho, proti čemu bude ze strany NV stát. NVIDIA podle mých informací řeší výrobní kapacity, řeší optimalizace a ráda by věděla, co AMD chystá. Finální nastavení taktů a tomu odpovídajícího výkonu a provozních vlastnostech teď bude opravdu důležité. Stejně tak to ovlivní ceny. NVIDIA si nemůže dovolit teď napálit ceny jako u RTX 2000, protože konkurenci mít bude. AMD ovšem zatím své produkty a informace o nich, úspěšné uhlídalo a jen oznámilo, že RDNA 2 bude o 50% efektivnější než současná generace (což NVIDIA výrazně znepokojilo, speciálně po demonstracích RDNA 2 v konzolích). RDNA 2 dorazí na trh v závěru roku. NVIDIA AMPERE herní grafiky by se měly představit v Q3, nicméně s uvedením na trh se počítá také až v závěru roku. A i tady si NVIDIA nechává otevřená vrátka, když prostě ještě nic přesného o herních AMPERE neřekla.
Rozhodně to tedy bude zajímavé a první AMPERE GA100 řešení naznačuje, že NVIDIA si tentokrát nemůže být úplně jistá ničím. A dle mého názoru není vůbec jisté, že NVIDIA bude mít nejvýkonnější herní grafiku na trhu i v nadcházející nové generaci … neříkám že ne, ale ani nevidím nic, co by nasvědčovalo, že ji mít určitě bude. konkurence se zkrátka vrátila a AMD se u RDNA (NAVI) snaží udělat to samé, co udělalo na procesorovém trhu s RYZEN. A víme, jak to dopadlo ;). Samozřejmě pro nás uživatele by byl fajn opravdu vyhrocený a těsný souboj, jak výkonově, tak cenově. A ideálně srovnání tržních podílů ideálně blízko 50:50, ne-li větší podíl pro AMD, což by byl konečně impuls pro NVIDIA trochu přidat. Zkrátka po letech snad konkurence, která tady delší dobu příliš nebyla. Zatím mohu říci, že souboj nové generace 7nm grafik obou společností bude mnohem zajímavější než mnoho posledních generací. Změnilo se totiž úplně vše, tedy až na NVIDIA. Ta je stejná. Jenže stojí proti zcela jinému AMD ve zcela jiné situaci, situace na PC je jiná, situace v herních technologiích díky AMD konzolím je jiná atd. Výrobci počítačů a hardware si od obou novinek slibují hodně, což ledacos naznačuje. Je škoda, že současná situace ve světě zkomplikovala věci kolem a podepíše se na produktech, speciálně na jejich uvádění a termínech uvádění na trh. Nicméně práce pokračují, zatím můžete být ještě několik měsíců v klidu, osobně vidím start prodejů grafickou novinek obou výrobců nejdříve na říjen, spíše ale listopad s možností odkladu a nebo větší dostupností karet až začátkem příštího roku (ano jsem trochu více pesimistický, snad se pletu) …
Pouze registrovaní uživatelé mohou přidat komentář! |