ATI R600 – co se povedlo, nepovedlo a může povést Tisk E-mail
Napsal no-X   
Čtvrtek, 14 červen 2007
Přejít na obsah
ATI R600 – co se povedlo, nepovedlo a může povést
A pokračujeme dále ...
Nevyužitý potenciál R600 a závěr ...

 

 

 

5, absence HD2900XTX - 1GB GDDR4

O HD2900XTX se nejdříve mluvilo jako o 850MHz čipu, pak se zmiňovalo 814MHz a nakonec zůstal jen ten gigabyte GDDR4 se standardně taktovaným jádrem na 740MHz jako OEM HD2900XT 1GB. Pro retail trhy by XTX měla kvůli nedostatečné frekvenci jádra špatný poměr cena/výkon, neboť rychlejší paměti této kartě na výkonu nepřidají, zato cenu ovlivní výrazně.

R600-obrazek

6, absence skutečných DX10 aplikací

Zmínil jsem to o pár odstavců výš - texturing engine je optimalizovaný pro potřeby DX10. Podobně je na tom ale i shadercore - výpočetní jednotky jsou uspořádány v pěticích, neboť je to výhodné pro geometrické operace, výsledky geometry shaderu jsou také velmi dobré. Ale chybějí aplikace, které by tyto DX10 technologie používaly - tyto výhody se neprojeví.

crysis

7, VLIW shader core?

Kritizována (zvlášť nVidií) je VLIW architektura. Jediný logický důvod, proč ji nVidia kritizuje je proto, že ji a G80 nepoužívá. VLIW nemá vliv na kvalitu grafického čipu. Využívaly ho prakticky všechny DX9 čipy - jak ty úspěšné, tak i ty neúspěšné, takže samotný fakt využití VLIW vůbec s kvalitou/výkonem/konkurenceschopností čipu nemá co dělat.

R600-jadro

Dále také byla R600 vytýkána (opět hlavně nVidií) přílišná složitost shader core, kvůli které je pro jeho optimální vytížení třeba velice komplexních řídících obvodů. Toto je opět pravda pouze zčásti - shader core R600 samozřejmě komplexní je. Ale ATi má na rozdíl od nVidie s programovatelnými řídícími a dispatch procesory zkušenosti už z Xenosu, R520 a R580, takže si podobný krok dovolit mohla a zatím nic nenasvědčuje tomu, že by v tomto směru měl R600 jakékoli problémy.

520architektura

Druhá strana mince je, že ani shader core G80 není zdaleka tak jednoduché, jak se ho nVidia snažila vykreslit. Krom toho, že řídící obvody pracují na jiné frekvenci, než samotné shader core, není jeho architektura čistě skalární, jak nVidia tvrdí, ale je ve skutečnosti dual-issue (na MADD jednotku je vázána SFU, kterou nVidia zmiňuje jen tehdy, pokud se jí to hodí. Pokud se jí to nehodí, jako v tomto případě tak o ní mlčí)

G80

Nejpozoruhodnější na tom všem je to, že nVidia, která měla vždycky shader core na horší úrovni než ATi, káže o tom, jak by mělo vypadat. Což je trochu komické, když zohledníme, že unifikace na R600 funguje od vydání naplno, kdežto na G80 zrovna jako po másle neběhá...

8, frekvence shader core G8x

Není dobré situaci hodnotit jen z hlediska "co ATi nevyšlo", ale také "co vyšlo nVidii". Protože pokud by G80 neměla takový výkon, jaký má, nikdo by se nad výkonem současné R600 nepozastavoval. Takže na chvilku odsuňme otázku "proč je R600 pomalejší" a zkusme se zeptat, "proč je G80 rychlejší". Odbočím ještě víc. Marketingové oddělení nVidie má po léta jednu úžasnou schopnost - pokud je produkt úspěšný, neodůvodní to skutečnou příčinou, která je za ten výkon zodpovědná, ale odůvodňuje to vždy prvkem, který má pouze její produkt. Např. proč je GeForce 256 rychlá? Protože má TnL. Pravda byla jinde - příčinou byl dvojnásobek pixel pipelines a DDR paměti, jenže právě TnL nikdo z konkurence nenabízel, takže pak působilo jako exkluzivní featura (= ideální marketingový tahák)

gf8800

Stejně je to s G80. Skutečným tajemstvím jejího výkonu není nic jiného, než shader core taktované cca na dvojnásobku frekvence čipu. Pokud bychom pro rozumný výkon potřebovali 256 výpočetních jednotek na běžné frekvenci, zaručí nám dvojnásobné frekvence, že pro dosažení stejného výkonu bude stačit jen polovina (128) jednotek. Ušetřené tranzistory a plochu čipu pak nVidia mohla využít pro více texturovacích jednotek a ROPs. Pokud by shader core G80 běželo na běžné frekvenci, musela by nVidia použít více jednotek (např. 160 nebo 192) a aby se do jádra "vešly", musela by zároveň ubrat ROPs a texturovací jednotky (TMUs: 32->24 a ROPs: 24->16). Výkon čipu by tím ve výsledku klesnul zhruba o třetinu. Klíčem výkonu G80 je tedy frekvence shader core.

R600-jadro-2

To je pro ATi v současné chvíli velice nepříjemné, neboť tuto výhodu je velmi obtížné překonat. Pozitivní pro ATi ale může být fakt, že výhodu "rychlého" shader core už nVidia využila, kdežto ATi ještě ne a potencionální třetinové navýšení výkonu může v budoucnu ještě je. S tím souvisí další potenciální výhoda ATi a to je výkon na jeden MHz.

Nevyužitý potenciál R600 a závěr ...



 
Poslední příspěvky v diskuzích


Videa
Řešení pro pohyb s VR setem?
Řešení pro pohyb s VR setem?Friday, 26 April 2024
Vložil: aDDmin
Kategorie: PC a IT
Spuštěno: 1176x
Komentářů: 0
S.T.A.L.K.E.R. 2 v nové ukázce
S.T.A.L.K.E.R. 2 v nové ukázceThursday, 25 April 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 2083x
Komentářů: 5
Manor Lords – hra jednoho vývojáře boří herní svět
Manor Lords – hra jednoho vývojáře boří herní světWednesday, 24 April 2024
Vložil: aDDmin
Kategorie: Počítačové hry
Spuštěno: 1918x
Komentářů: 1
Deadpool & Wolverine – očekávaný film v parádní ukázce
Deadpool & Wolverine – očekávaný film v parádní ukázceTuesday, 23 April 2024
Vložil: aDDmin
Kategorie: Film
Spuštěno: 1289x
Komentářů: 0
Fallout seriál se dočká druhé řady. Zájem je i o hry.
Fallout seriál se dočká druhé řady. Zájem je i o hry.Monday, 22 April 2024
Vložil: aDDmin
Kategorie: Film
Spuštěno: 1287x
Komentářů: 1
Unreal Engine 5.4 představuje další masivní vylepšení
Unreal Engine 5.4 představuje další masivní vylepšeníFriday, 19 April 2024
Vložil: aDDmin
Kategorie: PC a IT
Spuštěno: 3901x
Komentářů: 0