PREVIEW: AMD RYZEN ThreadRipper 2 upgrade pro X399. Nový 32jádrový 2990WX na DDWorld.cz!
Napsal Jan "DD" Stach a redakce   
Pondělí, 06 srpen 2018
alt

 

 

 

 

 

  • PREVIEW: AMD RYZEN ThreadRipper 2 upgrade pro X399.

                                                   Nový 32jádrový 2990WX na DDWorld.cz!

Nové Threadripper 2 exkluzivně na DDWorld.cz - Dnes vám můžeme prozradit, a hlavně ukázat první část informací a velkých novinek …

V loňském roce AMD překvapilo … ne, to není to správné slovo … AMD šokovalo IT svět tím, že po letech stagnace a minimálních posunů přišlo s procesory, které předčily veškerá očekávání a jednoznačně porazily soudobou konkurenční nabídku Intelu (až dodatečně na ni odpověděl, ale cenově stále nestačí). 8jádrové RYZEN 7 pro desktop byla jedna věc, ale 16jádrový procesor za 1000 dolarů pro high end? To nečekal vůbec nikdo. Připomínám, že ještě začátkem minulého roku bylo maximem, co jste si vůbec mohli do svého desktopového PC osadit, 10jádrový Core i7-6950X za 1729 dolarů a 8jádrový procesor (s výkonem RYZEN 2700 bez X) jste nemohli mít za méně než 30tisíc korun!

DDWorld.cz byl nedávno na speciální akci, kterou AMD připravilo spolu s Ferrari v rámci představení ThreadRipper 2 procesorů. Kromě jiného jsem měl možnost si osobně pohovořit se strůjcem tohoto projektu, který potvrdil, že ThreadRipper procesory a X399 platforma jednoduše vůbec nefigurovala v původních plánech AMD pro RYZEN. Teprve rok před jejím vydáním došlo ke schválení tohoto „vedlejšího“ projektu hrstky vývojářů. Jen o rok později však AMD dělá další veleskok a servíruje nám procesorový výkon, který do této doby byl vyhrazený jen víceprocesorovým serverům a pracovním stanicím za stovky i miliony korun. A to bez nutnosti pořizovat novou základní desku. Zatímco u jiných platforem musíte měnit desku pomalu s každou novou generací procesorů, ačkoliv jde jen o přejmenované, ale jinak stejné čipy, AMD nám pro stávající platformu X399 s TR4 paticí, do které jsme od loňského roku mohli osadit „jen“ až 16jádrový procesor, servíruje nové 12nm modely ZEN+, a to v čele s až 32jádrovým modelem RYZEN ThreadRipper 2990WX!

  • 32 jádrový Threadripper 2 je v ČR na DDWorld.cz!

Dnes, 6.8.2018, končí první část NDA a můžeme vám o nich hodně říci. Také vám ale můžeme všechny novinky ukázat, což je zejména pro nás nadšence v ČR velká událost. DDWorld.cz dostal možnost pro Českou a Slovenskou republiku udělat testy novinek a získal jednu z mála kompletní testovacích sad, které AMD vůbec rozeslalo do světa, kterých je opravdu jen několik pro celý svět a zdaleka ne všechny, i ty velké redakce, ji k dispozici mají. Jsme rádi že se nám podařilo sem tuhle novinku do ČR dostat, a doufáme, že to jako nadšenci v ČR/SK oceníte a stane se to pravidlem, protože loni, jak víte, tak testovací sada do ČR nedorazila žádná. Takže doufejme, že AMD ukážeme, že i fandové v ČR a SK o podobné novinky stojí a stojí za to je tedy k nám do ČR na testy pro vás posílat :).

  • AMD Threadripper 2

                               – nejvýkonnější desktopová platforma všech dob!

Upgrade, který určitě stojí za zvážení. Zatímco loni jsme si pro X399 platformu mohli pořídit maximálně 16jádrový RYZEN Threadripper 1950X, letos máte možnost si pro svou stávající AMD X399 desku, pořídit procesor s prakticky až dvojnásobným výkonem. Říkáte si, jaká kouzla a čáry to AMD použilo?

Nic zvláštního :). Zatímco loňské serverové procesory EPYC, které právě nabízí až 4 čipy a tedy 32jader/64vláken a 8kanálový řadič, zůstávají letos na 14nm a u ZEN architektury, AMD aktualizovalo ty běžné spotřební procesory. Místo 14nm je vyrábí nově 12nm a architekturu vylepšilo na ZEN+. Co to v praxi znamená, už jsme mohli zjistit u několika příležitostí:

TEST: AMD RYZEN 7 2700X – nový nejlepší mainstreamový procesor na trhu pro všechny!

ThreadRipper procesory jsou pak desktopovým high endem a zatímco s jejich serverovými příbuznými EPYC modely se na 12nm nesetkáme, protože u nich AMD půjde z mnoha dobrých důvodů až na 7nm (a už je má hotové a partneři je testují). U ThreadRipper 2 AMD použije letošní 12nm ZEN+ čipy a hodlá kromě klasických příznivců high endu, zaútočit i na regulérní pracovní stanice. Pro X399 platformu totiž nabídne nejen nové 12nm X modely s 12 a 16jádry, ale také nové WX modely s 24 a dokonce 32jádry. Tedy procesor s plně aktivními čtyřmi Zen+ čipy! Na rozdíl od serverových EPYC procesorů, které nehoní vysoké takty, ale vše je o spolehlivosti a efektivitě, WX procesory jsou i o vyšších taktech a maximálním výkonu.

Dnes vám můžeme prozradit, kolik vás novinky budou stát a jaký zhruba nabídnou výkon. A prozradíme vám i pár dalších informací …

 

 

  • Nabídka procesorů ThreadRipper 2 – výkony, ceny atd.

Jako první dorazí na trh právě nový TOP model TR 2990WX, který nabídne neuvěřitelných 32jader a 64vláken a to s taktem 3GHz v základu a 4,2GHz v Boostu. Ano, v podstatě se díváte na čtyři procesory RYZEN 7 2700X v jediném pouzdře! TDP čipu je 250W, ale na rozdíl od Intelu, který své TDP udává jen na základních taktech, na kterých ale CPU běžně neoperuje a realisticky je tedy TDP mnohem vyšší, u AMD je to běžné realitě odpovídající hodnota.

Dnes vám zatím nesmím říci některé podrobnosti, ačkoliv už znám vše, včetně výkonu, zejména na jakém reálném taktu, s jakým chlazením tenhle procesor běžně jede a nesmím vám ukázat ani kompletní testy, ale mohu vám ukázat některé nástřely :).

Ve srovnání se současným TOP desktopovým procesorem, kterým je ultra drahý 18 jádrový / 36 vláknový Intel Core i9-7980XE s cenou 1999 dolarů (cca 51 tisíc korun) vám AMD nabídne až o 51% vyšší výkon! Ano, nejlepší procesor, který Intel vůbec pro desktop nyní nabízí, má sotva poloviční výkon. AMD navíc TR 2990WX nabízí za „pouhých“ 1799 dolarů, tedy za cca 47 tisíc korun! Není levný, ale ještě před rokem nám za to byl nabízen jen 10jádrový čip …

Kromě 32jádrového TR 2990WX bude AMD nabízet také levnější 24jádrovou variantu TR 2970WX za 1299 dolarů, tedy cca 34 tisíc korun. Ta má také 250W a stejné takty 3GHz v základu a 4,2GHz v boostu. Na trh ale dorazí až v říjnu. AMD jednoznačně a správně určilo 24 a 32jádrové Threadripper čipy jako pro pracovní stanice. Z hlediska hraní her totiž tyto čipy jednoznačně narážejí na velké nedostatky programátorů her a jejich chyby. Jednoduše některé hry vůbec nepočítají s tolika jádry ani s určitou konstrukcí paměťového řadiče.

Pravdou je, že i řada profesionálních aplikací prostě nedokáže plně tolik jader a výkonu využít. Existují aplikace, které prostě budou tvrdit, že 32jádrový RYZEN je stejně výkonný, jako 18jádrový Core, což je prostě hloupost. V řadě aplikací tak prostě nejsme schopni vůbec otestovat výkon samotného procesoru, ale jen ukázat, jak moc je daná aplikace bez optimalizací a jak málo výkonu, který nové procesory nabízí, využívá. AMD ale nabídne dvě varianty vícejádrových CPU pro high end, určené i pro hráče her.

  • AMD RYZEN ThreadRipper 2950X/2920X

12nm nové verze stávajících 12 a 16 jádrových modelů jsou také na cestě. V redakci máme spolu s novým 32jádrovým ultraprocesorem, právě i tu 16jádrovou variantu TR 2950X. Ta proti první generaci 1950X nabídne zejména podstatně vyšší takty a lépe fungující boost, kdy základ je 3,5GHz boost však fantastických 4,4GHz. Víceméně bude rozdíl ve všem „stejný“ jako je mezi RYZEN 7 1800X a 2700X.

Procesor má reálných 180W TDP a AMD jej nabídne za skvělých 899 dolarů, tedy o 100 dolarů méně, než původní cena 1950X verze z loňského roku. Za 22-23 tisíc korun je to pořád méně, než co zaplatíte za pouze 10jádrový Intel Core i9-7900X. Ten stojí 25 tisíc.

Všude tam, kde na výkonu opravdu záleží, tedy je využito náležitě všech jader/vláken a skutečného výkonu CPU, má AMD klidně 30-40% náskok ve výkonu. AMD se nestydí přiznat, že ve hrách je situace mnohem vyrovnanější, ale testováno je v 1080p, což v podstatě nikdo s takto drahým CPU nehraje (má 2K nebo 4K a bude situace zcela vyrovnaná, někdy pro AMD i lepší). Z hlediska hraní her je tenhle procesor přínosem proti RYZEN 7 2700X a mainstreamu zejména při současném hraní a třeba streamování her. Na TR 2950X dokáže současně hrát ve 4K rozlišení a zároveň streamovat ve vysoké kvalitě ve 4K rozlišení a nezaznamenáte žádné propady FPS ani sekání streamu. Tenhle procesor je typicky určený pro uživatele (jako jsem já), který pracuje s mnoha aplikacemi naráz a současně v přestávkách hraje hry atd.

TR 2950X si budete moci koupit na konci Srpna, kdy dorazí do obchodů. V říjnu pak dorazí ještě 12jádrová varianta TR 2920X s 3,5GHz v základu a 4,3GHz v boostu za 649 dolarů, tedy cca 17 000 korun vč. DPH. To je cena, za které vám Intel dnes prodá maximálně 8jádro :).

(běžné balení každého ze 4 modelů ... )

A ještě vám můžeme prozradit pár věci …

 

 

  • Závěr - Kompatibilita s X399 zaručena, nové desky, chlazení atd.

Bude o tom řeč v testu 32jádrového TR 2990WX procesoru. Je totiž pravdou, že teoreticky jej mohlo AMD udělat ještě výkonnější. Chtělo ale zachovat kompatibilitu nových 12nm TR se stávajícími X399 deskami, které vyšly před rokem. Možná někteří uživatelé konkurenční platformy budou překvapeni, protože tam je zvykem měnit desky, i když třeba měníte jen 4jádro za nové 4jádro, které je nové jen podle jména. Ale u AMD prostě můžete použít starší desku pro nové procesory.

Stačí update BIOSu, což už všichni výrobci všech X399 desek nabízí. Někteří však budou nabízet ještě více, například ASUS má přídavné chlazení pro některé své desky. Je pravda, že zejména 32jádrový model, když se pustíte do jeho taktování, tak dokáže mít hodně vysokou spotřebu, ale také výkon, který je mnohem vyšší, než jakýkoliv procesor, kterým jsme doposud v desktopu viděli.

Přesto stávající X399 desky, původně navržené jen pro 16jádra, dokáží bez potíží 32jádro obsluhovat. Pro maximalisty pak Gigabyte a MSI nabízí i dvě nové desky s extrémně silnými napájecími kaskádami. Novou Gigabyte X399 zatím k dispozici nemám, ale MSI MEG Creation X399 ano.

Kromě ní tu mám v redakci i ASUS ROG ZENITH, právě vybavený přídavným chlazením. Desky jsou, nebo brzy budou dostupné v obchodech, ale jak jsem řekl, můžete použít i jakoukoliv stávající X399, kterou již máte doma. Stačí udělat jednoduchý update BIOSu.

  • Chlazení

Podobné je to i s chladiči. AMD nebude k žádnému ze 4 nových čipů přidávat v balení chladič. U procesorů tohoto typu je to docela pochopitelné. Nicméně „oficiální“ BOX Wraith cooler existovat bude a existuje. A mám jej také k dispozici, takže vám jej také brzy ukáži (a hlavně otestuji v praxi) …

Ve spolupráci s Cooler Master připravilo AMD referenční chladič Wraith Ripper. Jde o velkou věž se 120mm ventilátorem uprostřed a pěkným RGB posvícením. Samozřejmě má velkou základu, kryjící celou plochu procesorů TR. Chladič bude prodávaný samostatně. Na trhu existuje i několik dalších klasických chladičů podobného typu. V redakci máme například hned tři modely NOCTUA pro TR4 a v nabídce jsou i další klasické vzduchové chladiče od jiných výrobců speciálně pro TR4 (ty klasické univerzální se kvůli malým základnám a jiným upínkám použít nedají).

Ačkoliv se TDP procesorů (180W a 250W) zdá vysoké, tak i ten normální Wraith Ripper (nebo podobná NOCTUA NH-U12 TR4), bez potíží stačí na tiché uchlazení 32jádrového modelu a to i s přetaktováním! Nebudu vám zatím říkat podrobnosti, jen že stačí přepnout jediný přepínač v AMD Ryzen Master, a dostanu se na vyšší výkon, než jakýkoliv současný desktopový procesor od Intelu (včetně 18jádra) dokáže i s extrémním chlazením dusíkem apod. A pořád nemusím sáhnout po vodě. Ale i taková řešení budou. Nabídka AiO, ale i velkých vodních okruhů speciálně pro TR4, se rozrůstá, také máme jeden k dispozici a další jsou na cestě. Samozřejmě nadále je možné jako použitelné řešení použít jakékoliv AiO s ASETEK konstrukcí, spona je stále k dispozici v základu u procesoru v příslušenství. Ty klasické kulaté základny, které tato univerzální AiO mají, sice nepřekryjí celou plochu heatspreaderu, takže přenos tepla není úplně ideální, ale fungovat to bude bez potíží.

  • Závěr

12nm RYZEN Threadripper procesory posouvají hranice běžného CPU výkonu. Bohužel také natvrdo odhalují, jak mizerná je optimalizace i profesionálních aplikací. AMD dodává hardware, ale tvůrci software selhávají v jeho využití. Katastrofálně je na tom například ADOBE se svými aplikacemi, ale i celá řada jiných. Neomlouvá je nic. Ne velké bohaté SW společnosti, které rozhodně mají peníze, vývojáře a čas i schopnosti ty optimalizace dodat dříve, než se daný hardware vůbec dostane na trh. Ale naštěstí ne všichni jsou přeplacení flákači a řada aplikací aktualizovaných už je a AMD hlásí, že lépe a s větším množstvím vývojářů a partnerů nikdy nespolupracovalo a situace se tak bude jen lepšit.

Také neexistuje nic jako dostatek procesorového výkonu. Dokud kliknete a musíte čekat na dokončení úlohy a výsledek, tak nemáte dost výkonu! AMD Threadripper ukazují, že ho ale můžeme mít mnohem více, než doposud, za mnohem lepší cenu. Zažíváme zlatou éru procesorů a fungující konkurenční nabídky v rámci trhu, kde konkurence skoro dekádu nebyla. AMD za jediný rok posunulo dostupný procesorový výkon o několikanásobek toho, co Intel za téměř dekádu svého bezkonkurenčního vládnutí. A to má Intel stále výhodu v tom, že drtivá většina aplikací je stále optimalizována výhradně na jeho čipy, používá zastaralé optimalizace a spousta aplikací ještě nemá ani pořádné optimalizace pro více jader. Situace se ale zlepšuje a zlepšovat bude. Nové verze aplikací se objevují, a druhá generace RYZEN procesorů už zajímá i velmi bohaté firmy. Nemohou totiž ignorovat výkon, efektivitu a tu cenu, za jakou je AMD nabízí a stejně tak nemohou ignorovat bezpečnostní nevyřešitelné bezpečnostní díry a problémy, které mají současné procesory Intel, kvůli kterým se záplatuje a klesá jejich výkon i spolehlivost. AMD naštěstí svou architekturu zabezpečilo více a nutné opravy a záplaty výkon a stabilitu jeho aktuálních RYZEN platforem neovlivňují.

Spousta firem potřebuje stále více výkonu, a hlavně platí licence za software podle počtu procesorů, tedy instalovaných socketů. A je velký rozdíl, když mají rozpočet třeba 1 milion dolarů a mohou za to nakoupit PC s 18jádrem nebo podobný počet PC s 32jádrem. Obrovský rozdíl ve finálním výkonu i následných nákladech na vše. Náš magazín vám bude moci nabídnout postupně testy novinek. DDWorld.cz získal k dispozici kompletní testovací set a TR 2990WX i TR 2950X procesory, spolu s novými deskami atd. Na testech už pracujeme, budeme je vydávat postupně od 13.8.2018, kdy končí NDA a začíná dostupnost v obchodech (32jádra). Již nyní si můžete v ČR před-objednat 2990WX. Mimochodem pokud se ptáte, zda bude k dispozici i 8jádrová varianta, tak nebude. AMD totiž podle prodejů první generace zjistilo, že 16jádrová nejdražší verze se prodávala mnohem lépe než 12 a 8jádrová verze dohromady (očekávalo přitom velkou poptávku hlavně po 8jádru). U nové generace se tak rozhodlo produkovat a nabízet zejména 32 jádrový a 16jádrový model přednostně. 24 a 12 jádrové verze budou proto později (říjen) a 8jádrová edice vůbec. Je pravda, že AMD má nyní docela velkou díru v nabídce mezi RYZEN 7 2700X AM4 za 329 dolarů a 12jádrovým TR 2920X TR4 za 649 dolarů. Ale starší čipy, které jsou v zajímavých slevách, se ještě budou nějaký čas doprodávat. Taktéž pokud jsou lidi ochotni dnes platit 10-12 tisíc za 6 jádrový čip a 13-14 tisíc za 8jádrový procesor konkurence, tak 17 tisíc za 12-ti jádro od AMD, zní pořád objektivně jako zajímavější nabídka a kdo má 10 – 14 tisíc na CPU má i 17 tisíc na něj. Ač by mě dával 8jádrový „TR 2900X“ za třeba 499 dolarů smysl v rámci nabídky, z prodejů z první generace vyplývá, že většina lidí stejně bude kupovat 16 nebo 32 jádro. To by ostatně byla i má volba, když už X399 platformu.

Pokud se mě ptáte, který procesor bych doporučil, tak pokud to s pracovní stanicí myslíte vážně, tak 32jádrový model je nepřekonatelná nabídka, který navíc bude jen „získávat na praktickém výkonu“, s každou další optimalizovanou aplikací. Zde mě trochu mrzí například ASUS a jeho absence X399-WZ modelu základní desky (ASUS měl vždy zajímavé Work Station modely). Ta by se na to přitom perfektně hodila. Vůbec všimli jste si, že ASUS má WZ modely pro Z370 i X299 ale ne pro X470/X399, kdy AMD platforma je pro WS použití z mnoha důvodů vhodnější a výhodnější? Nová MSI MEG Creation ale vypadá fantasticky a novinku od Gigabyte (AORUS X399 Extreme) už jsem si také mohl prohlédnout. Každopádně mám několik dní ve svém PC místo starého TR 1950X nainstalován právě nový TR 2990WZ, a je to absolutní masakr, když jeho výkonu dokáže aplikace využít. A stačilo jen vyměnit CPU a nahrát nový BIOS na stávající desku. Nicméně pokud zase neděláte tolik velkého počítání, pak je právě nový 16járový TR 2950X ideální domácí procesor pro hráče/streamera/tvůrce video-grafického obsahu. Hraji hry bez ztráty FPS při současném zpracovávání videa a několika stále puštěnými dalšími aplikacemi v pozadí. A žádný problém, žádné sekání, trhání, pokles FPS. Prostě vše běží plynule. Spotřeba není extrémní, chladit se dá tiše i vzduchem (mám na tom Noctua U12-TR4). Pro mě osobně je za současných podmínek TR 2950X ideální domácí procesor.

Ovšem pro náročné tvůrce obsahu, kteří dokáží využít maximum HW prostředků, je 32jádrový 2990WX doslova splněný sen za až neuvěřitelně nízkou cenu ve srovnání s tím, kolik mnoho set tisíc korun museli za alespoň podobný výkon dosud platit, nemluvě o spotřebě atd. Ale můžete jej mít i vy. 32jader / 64 vláken v kompaktním provedení domácího PC. Ještě začátkem loňského roku, pokud by někdo řekl, že AMD uvede na trh desktopový 32jádrový procesory za necelých 50 tisíc s výkonem několikanásobku toho, co jsme za ty peníze tehdy měli, zavřeli by ho do blázince. Dnes je to ale krásná realita.  

Takže nás sledujte dále, budeme mít pro vás brzy další zajímavé informace, články i testy a možná nějaké to video :).

 

AUTOR: Jan "DD" Stach
Radši dělám věci pomaleji a pořádně, než rychle a špatně.

Starší články


Komentáře
Přidat Nový
vantages [Zobrazit profil] [Poslat zprávu] 2018-08-06 21:21:29

B.R.U.T.U.S

intel rulezzz
tastu [Zobrazit profil] [Poslat zprávu] - matika 2018-08-07 06:54:48

"Intel Core i9-7980XE s cenou 1999 dolarů (cca 51 tisíc korun) vám AMD nabídne až o 51% vyšší výkon! Ano, nejlepší procesor, který Intel vůbec pro desktop nyní nabízí, má sotva poloviční výkon."
Chtělo by to zopáknout procenta
Když je něco o 51 % větší, tak to neznamená, že ten základ je 2x menší
Dr. evorubač [Zobrazit profil] [Poslat zprávu] 2018-08-07 07:55:30
avatar
DD, bude aj porovnanie s ECC RAM a napriklad s 3600MHz nonECC?
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 09:56:03
avatar
nemáme ECC paměti navíc to je zajímavé skutečně jen pro minimum lidí zejména s ohledem na cenu, ale je to možnost u RYZENu ...
Janosik [Zobrazit profil] [Poslat zprávu] - chladenie 2018-08-07 10:47:02

kedze mas cely kit mas tam aj ten coolermaster chladic a na ten som celkom zvedavy ! dufam ze to riadne potestujes s 16 aj 32 jadrovym TR ako default tak aj nejake to oc v idle a v loade , ten load by bol super nejaky render engine klasicky cinebench ale ak by si mohol skusit aj cesku corona render alebo este vray benchmark .

dakujem !
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 11:07:25
avatar
jj, je v té velké krabici s TR 2990WX, ukáži jej v dalším článku, případně videu ...

ano, máme v plánu trochu změnit testovací programy, přeci jen 32 jádro ....
Kýbl [Zobrazit profil] [Poslat zprávu] 2018-08-07 15:21:43
avatar
To streamování společně s hraním ve 4K by mohlo být na test zajímavé. + renderování videa, ať se trochu zapotí
RiMr [Zobrazit profil] [Poslat zprávu] 2018-08-07 11:19:57
avatar
S Adobe je to tak, že jednotlivé aplikace dělají různé týmy a to, že jde o produkty jedné firmy je často jen takové vizuální pozlátko.
Například Photoshop a InDesign využívá více vláken hanebně špatně, kdežto PremierePro a AfterEffects (MediaEncoder) "sežerou" všechno co jim podstrčíte, na Intelu i AMD.
A třeba SOlidworks pořád využívá AMD Ryzen tak nějak divně, max. na 30-50%.
Objektiv [Zobrazit profil] [Poslat zprávu] 2018-08-07 11:34:16

Takových programových molochů je spousta. třeba autodesk. Jejich inventor je tragický co se týče využívání výkonu. Před 2 roky koupily powermill a uz jej prodavaji jako svuj program a powermill je na tom o poznání lépe při užití CPU jader.

Pokud chtete testovací univerzální SW tak použijte třeba Blender a jeho render engine. Výhoda je v tom, že na něm můžete ostestovat sílu všech jader, ale potom také jak si vedou grafické karty a dělat tak přímé srovnání. Výhoda Blenderu je že podporuje jak nvidia CUDa renderery tak i AMD a pov ray.
fagot [Zobrazit profil] [Poslat zprávu] 2018-08-07 13:23:19

Jakožto zástupce programátorů (tedy podle DDho jsem vlastně buďto hlupák neschopný paralelizace a/nebo člen globálního spiknutí, který neparalelizuje schválně aby škodil AMD :-p ) bych doporučil, aby si každý nastudoval co to vlastně obnáší, proč některé věci principiálně paralelizovat nelze nebo se to energeticky nevyplatí (buďto spočítám něco za 10s na jednom jádře, nebo to předělám na více vláken a spočítám to za 9 a vytížím pritom 4 jádra) nebo se to nevyplatí finančně (algoirtmus uděláme jednovláknový za 10 člověkodnů nebo vícevláknový za 500 člověkodnů (1:50 není vycucaná hodnota ale kvalifikovaný odhad který dělám po mnoha letech praxe)). Nebo že jsou věci, ktere prostě jsou principiálně jednovláknové, třeba javascript(!!!), a pokud v nich dělate, tak můžete 100x chtít a paralelizovat nemůžete.

A k tomu si přičtěte neuvěřitelnou krutost Amdahlova zákona (koukněte na Wikipedii), který je sice jasný jako facka ale člověk si to na první pohled neuvědomí (pokud úloha se dá rozdělit na čísti z nichž 90 % perfektně škálují a 10 % neškáluje, tak je myslím každému jasné, že se nedá urychlit víc jak 9x ani přidáním milionu jader). A také laik neví, jaké jsou poměry v reálných aplikacích. U her budeme rádi za 80:20 BTW.
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-07 14:47:11

Naprosty souhlas, programovanim se take uz 10 roku zivim (20 roku se tomu venuju) a celkem mi vadi tyhle subjektivni nazory autora, kdy o tehlech technickych vecech obcas nic netusi, ale musi na ne napsat vlastni subjektivni nazor, ktery je uplne mimo.

At uz je to tohle nebo treba jeho tvrzeni kdyz vysly prvni testy poctu drawcallu ve Vulkanu vs DX11, kde tvrdil, jak se placa v DX11 vykonem a ze nam stoupne vykon o stovky procent, ale pritom si neuvedomil, ze je to jen pocet prazdnych drawcallu, jakmile v nich neco bude, tak ten rozdil bude mnohem mensi a ze u dobre napsanyho rendereru (pouzivani instancingu, sortovani podle textur/shaderu apod., aby se pocet drawcallu minimalizoval) tu rezii dokaze snizit tak, ze rozdil mezi DX11 a VK bude minimalni.

Nebo treba v tom, ze jsem tu nedavno nekde cet vetu ve smyslu ze "protoze ten engine bezi na DX11, tak neumi efektivne vyuzivat vic jader", coz je samozrejme nesmysl, protoze i DirectX 1 aplikace muze klidne vyuzit 32 jader .
Objektiv [Zobrazit profil] [Poslat zprávu] 2018-08-07 14:59:54

Jste snad nějaký odborník?
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 15:08:14
avatar
jsou věci, které se samozřejmě nedají optimalizovat na využití více jader, ale zejména v oblasti her je asi milion věcí, o které by hra mohla být lepší, hezčí a funkčnější a dalo by se na to využít vícejádrových CPU ... kdyby byl zájem a nebyli vývojáři a vydavatel líní ...

DX11 samozřejmě může využívat více jader, ale pokud vím, tak DX12/VULKAN jsou na to lépe zařízeny a připraveny ...
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-07 17:27:33

Citace:
ale zejména v oblasti her je asi milion věcí, o které by hra mohla být lepší, hezčí a funkčnější a dalo by se na to využít vícejádrových CPU ... kdyby byl zájem a nebyli vývojáři a vydavatel líní ...

Tak samozrejme by se dalo najit spousta veci, kde to vyuzit, ale jak uz padlo vejs, hlavni problem je cas/penize, kdy napsat neco vicevlaknove muze stat klidne i o nekolik radu (=treba 100x) vic casu (=penez).

Ono totiz pri vyuziti vice vlaken je problem v tom, ze pokud obe vlakna pristupuji na stejne misto, tak se musi resit synchronizace a to muze byt pomerne casove draha zalezitost, ze to ve vysledku bude pomalejsi nez kdyz by to bezelo na jednom vlaknu.

A bez te synchronizace to nejde - napr. pri hledani cesty vojaku v mape je nutne tam tu synchronizaci mit jednak kvuli tomu, aby hledali cestu jen ve chvili, kdy ta mapa je validni (=nikdo jiny ji nemeni pod rukama) + musi kazdy z tech vojaku mit svoji cast dat pro vypocet cesty, coz zvysuje naroky i na pamet...

Je to proste opravdu cele hodne slozite

Citace:

DX11 samozřejmě může využívat více jader, ale pokud vím, tak DX12/VULKAN jsou na to lépe zařízeny a připraveny ...

Tusite, aspon v cem a jak jsou na to lepe pripraveny, kdyz to pisete?
Bumpkin [Zobrazit profil] [Poslat zprávu] 2018-08-07 15:52:51

a ted jako chcete trolit nbo co tím chcete říct?

věčně se tu poukazuje na to jaký je směr... už dávno se ukázalo že zvedat takt a snižovat velikosti není fyzikálně možné

moorův zákon začíná drhnout... a jediná schůdná cesta je přida jádra aby zůstal posun ve výkonu...

tohle všechno brblání, že tohle nejde tamto nejde mě přijde jako rok 2003 kdy AMD uvedlo Athlon 64 a že není tak jednoduchá všechno předělat na 64 bit a dneska už vlastně jinak novej SW nevzniká...

jasě je to složité je to pracné a ano ne všechno lze dělat multi a paralelě, ale stále je levnější a jednodušší upravit a vymyslet SW jak obejít fyziku....

jasně to sám ukazuje Intel se svým 10nm procesem, je to tak složité a těžké dát do kupy pro velkej monolit, že to slibuje už 4 roky!! a nic!! tedy to není cesta...

cesta je přizpůsobit celou platformu na velký počet výpočetích jader.... protože to je schůdné, jde to uplatit a jde to hlavně i fyzicky vyrobit...
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-07 17:14:18

Citace:
tohle všechno brblání, že tohle nejde tamto nejde mě přijde jako rok 2003 kdy AMD uvedlo Athlon 64 a že není tak jednoduchá všechno předělat na 64 bit a dneska už vlastně jinak novej SW nevzniká...

problemy s 64bit byly v podstate jen v tom, ze sis musel hlidat, jestli se nesnazis pouzivat 32bit knihovny v 64bit aplikacich nebo obracene apod., ale tyhle problemy se uz resily i pri prechodu 16->32 a nebyl to zadnej podstatnej problem.

Pokud pises uz ciste 64bit aplikaci, tak tam pro tebe neni zadnej podstatnej rozdil pri programovani oproti 32, jen mas proste jinak velky pointery.

Ale u tech vic vlaken je to proste o tom, ze to cely musis postavit uplne jinak a musis resit mnohonasobne vic problemu pri psani.
fagot [Zobrazit profil] [Poslat zprávu] 2018-08-07 17:47:27

Tohle vůbec nejde srovnat. Kernel linuxu a většina OS softu byla pro x64 připravená dříve, než měli programátoři k dispozici fyzický kus hardwaru. Čistě 64bit distribuce byly použitelné pro běžné použití skoro hned po vydání hardwaru. Ve windows byl problém pouze z toho důvodu, že když máš koupené knihovny v binární podobě kompilované pro 32bit a nemáš k ním zdrojáky, tak nemůžeš udělat svůj soft 64bit bez hnusného wrapperu, proto to tam trvalo tak dlouho.

Mimochodem paralelizace se řeší mnohem déle než od 2003. Já měl v roce 2000 legendární desku Abit BP6 se dvěma celerony 366@500MHz A víceprocesorové stroje byly ještě o dost dříve v profi sféře.

Abych to shrnul - srovnávat 32bit->64bit a paralelizaci je jako srovnávat sčítání a integrování :-)
Phosgore [Zobrazit profil] [Poslat zprávu] 2018-08-08 08:26:18

Jo, jenže já mám pocit, že někde se furt hodně dlouho sčítá místo aby se integrovalo

Fujtajxl, jsme si musel pustit render, abych taky jednou viděl vytížená víc než dvě jádra
Bumpkin [Zobrazit profil] [Poslat zprávu] 2018-08-08 09:32:54

heh situace je naprosto stejná..... jako tehdy.. OS je ready a HW už delší dobu taky, tedy vývojář se měl už dávno přizpůsobit....

Nikdo tady nevrdí, že to je jednoduché a nikdo netvrdí, že jde všechno škálovat.... kažopádně už dávno se měl prosadit tento princip a to z několika důvodů:

1. fyzika nejde obejít a pod 1 nm prostě ve výrobě nelz jít tedy není kam klasickým způsobem zvysovat výpočetní výkon na jádro...

2. škálování a multi cpu je nejzchůdnější řešení které se teď prosadilo a to aniž byse musela architektura stávajícího řešení měnit!!!

Situaci bych spíše přirovnal k tomu když přišlo 3D a vystřídalo 2D, princip v určitých věcech zůstal (jisté věci z 2D nejdou převést do 3D protože by to pak vypadalo blbě nebo by stím nešlo pracovat)....

bohužel velký počet jader a škálování aplikace není tolik cool jako její vizualizace...
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 12:29:37

Asi jsi to nepochopil. Nevadi, shrnu to tu pro tebe znova:

1. Vytvareni novyho threadu nejakej cas a pamet stoji, muzes sice pouzivat threadpool - mit uspany cekajici vlakna, ale i tak tam porad rezie je.
Pokud ta cinnost je kratka a trva mensi dobu, nez pripravis vlakno, uz se ti to nevyplati.

2. kod pro vice vlaken je vetsinou o dost slozitejsi -> trva dyl ho napsat, odladit a je to drazsi, klidne nasobne.
Takze musis porovnat, jestli to ma smysl v danou chvili to resit vicevlaknove nebo to pres jedno vlakno ma dostatecnej vykon.

3. Ke dvojce se vaze i to, ze ve vice vlaknech je mnohem snazsi udelat chybu, protoze tam musis resit to, ze ti muzou dve vlakna pristupovat na jedno misto v pameti najednou a v lepsim pripade rovnou shodit aplikaci, v horsim tam nadelat bordel (horsi je to v tom, ze se ti pak muzou zkazit data nekde dal a ty si toho ani nevsimnes).

4. S trojkou souvisi tenhle bod - sdileni dat mezi vlaknama neni jednoduchy, hlavne pokud se muze nejaka cast dat menit a jiny vlakno na to pristupuje, tak se ta cast musi zamykat, aby tam nemohly obe vlakna najednou, tomu se rika synchronizace. Hlavni problem nastava, kdyz je takovych mist v programu vic a roste mnozstvi vlaken, pak se muze klidne stat, ze se ceka na pristup do te tzv. "kriticke sekce" tolik, ze je to pomalejsi nez kdybys to mel v jednom vlaknu.


Tady nikdo neodporuje tomu, ze vic vlaken je cool a je dobry to vyuzivat, kde to jen rozumne jde.
Co se tu snazime rict je to, ze to proste neni tak ruzovy - nekde to nejde pouzit vubec, nekde to neni tak efektivni, jak se muze na prvni pohled zdat a hlavne je to vetsinou hodne komplikovany, takze si clovek musi rozmyslet, jestli to za to stoji - at uz cenou za vyvoj, vetsi sanci na chyby a nebo pokud to neni vhodny problem k paralelizaci, ze to i muze bejt pomalejsi a jen tim jeste sezeres vlakna navic...
Bumpkin [Zobrazit profil] [Poslat zprávu] 2018-08-08 13:54:28

pochopil sem vsechno nemusíš to základně vysvětlovat

ty jen ale uvádíš výmluvy a jasně definuješ to co tu bylo řečený, tedy to že většina lidí jde radši tou jednoduchou cestou a běda jak by měli vybočit... radši budeš argumentovat tím, že to je drahé a složité místo aby jsi se logicky nad tím amyslel a uvědomil, si že se prostě zpět nikdy nepůjde, a že se to bude jen a jen paralelizovat, a že to stejně dřív nebo pozdějc bude nutné předělat a domyslet....

jasně dneska je to takhle, ale kdybychom takto přemýšleli pořád tak stále chodíš pěšky, bydlíš v jeskyni a žereš kořínky

chápu, že to co mi tu píšem nemá vůbec smysl u jednorázový aplikace, ale pokud píšeš prostě nástroj pro celosvětové použití tak prostě tě tohle bude čekat dřív nebo později...

to že mi tu píšeš krásný litanie o tom jak musíš o tomhle a tamtom přemýšlet když něco děláš a že tamto musíš brát v potaz, tak ti jen řeknu že to vymysli jinak... tím začíná pokrok

AMD to taky muselo udělat takto a muelo všem ukázat že to jde jinak viz mantle a následně Vulkán a DX12 nbo tesla a nebo pan Benz a jako poslední extrém Daniel Přibáň

já bych taky u všeho mohl přemýšlet o tom proč to nejde nebo proč je to složitý, ale takhle nikdy myslet nechci, chci se posouvat, chci se učit.... jestli takhle přemýšlíš tak to potěž koště
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 14:30:25

Snazil jsem se ti to takhle vysvetlit, ze ctverec kulatej proste neudelas, at se budes snazit sebevic, ale koukam stale jsi to porad nepochopil.

Takze jeste jednou - jsou vypocty:
1. kdy to vyuzit jde a je to efektivni
2. kde se to da napsat paralelne, ale rychlost nebude takovej zazrak - klidne treba na plne zatizenych 16 cores jen 2x rychlejsi
3. kde samotnej algoritmus paralelne napsat nejde a nebo jde, ale ve vysledku je stejne rychlej nebo pomalejsi nez single thread

A hlavne o tretim pripadu tu celou dobu mluvim a ty porad nejsi schopny pochopit, ze takovych pripadu je spousta.

Samozrejme v prvnim a i druhym, kde ten pomer aspon trochu dava smysl je super psat paralelne, proti tomu nikdo nic nenamita.

Ale v ty treti situaci nedava smysl si treba 100x zeslozitovat kazdej kus kodu, 100x zdrazovat celej projekt a psat to vicevlaknove, kdyz by ti vykon budto klesnul nebo se nehnul.

Cely to je proste o tom, ze paralelizovat ma smysl jen algoritmy, ktery jsou k tomu aspon trochu vhodny, ale spousta jich na to vhodnych neni vubec a tam to nedava zadnej smysl.

Uz chapes, co tim myslim?
Bumpkin [Zobrazit profil] [Poslat zprávu] 2018-08-08 19:59:56



tak znovu a strucneji....
ano vým co jde zjednodušit a co nejde
a ty to furt ne a ne pochopit

ted je jeste cas se na to vysrat, mozna 10 let mozna vic ale pochop uz doprcic konecne ze ty tvoje varianty se musi omezit na minimum.... uz ted se zkousi neuronova sit ktera je tvořena prave podobnýma cpu jednotkama a jeji sila neni o tom ze zvladne super operaci a super algoritmus ale v tom ze jich je nekolik tisíc!!!

A o tomhle ti tu píšu a mluvím, výkon 1 jádra bude už dneska +- stejnej ale síla bude a byla vždy o tom že je zpřáhnes víc.....

Intel si uz namlel hubu ze chtel 10Ghz cpu a nepovedlo se mu to... je proti němu fyzika...

jestli k tomu bude potřeba více nových instrukcí proc ne, nebo unifikovat více bloky v kterých jsou jádra, to nedovedu říct, ale už dneska jasně vím, že to co píšeš a popisuješ přestává platit.....

ten kdo bude chtít udržet krok bude vymýšlet SW tak aby šel využít právě na těchto platformách, budeli to znamenat opustit principy toho co se dneska považuje za standard tak vyhraje ten kdo to udělá jako první....

jo vim ze neco nejde a sám sem to v predchozích přízpěvcích psal, ale znovu ti tu píšu že to je o tom aby ty si vylezl ze svého omezeného myšlení a když ti něco schází nebo to ve tvém oboru nejde máš se zajímat o to jak to udělat jinak a třeba zkusit zabruslit i jinam....
Objektiv [Zobrazit profil] [Poslat zprávu] 2018-08-08 20:32:43

BUMPKIN
Ignorant level 1 000 000.
!!*Congratulations*!!

Ty to v té hlavě musíš mít hodně zamotaný. Asi by jsi měl přepnout minimálně na HTčko.

Je super číst od někoho kdo nemá páru, rady o tom jak by se mělo programovat. Obsahujíc slova jako někdo, nějak a někdy.
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 21:19:26

Bumpkin ty jsi dobrej Mimoň

Citace:
ano vým co jde zjednodušit a co nejde a ty to furt ne a ne pochopit

Tak proc se nejdes zivit programovanim, kdyz se v tom tak vyznas?

Citace:
ted je jeste cas se na to vysrat, mozna 10 let mozna vic ale pochop uz doprcic konecne ze ty tvoje varianty se musi omezit na minimum.... uz ted se zkousi neuronova sit ktera je tvořena prave podobnýma cpu jednotkama a jeji sila neni o tom ze zvladne super operaci a super algoritmus ale v tom ze jich je nekolik tisíc!!!

Neuronova sit je zrovna vec, co jde paralelizovat skvele.
Ale neuronovou sit nemuzes (efektivne) pouzit na vsechno.

Citace:
A o tomhle ti tu píšu a mluvím, výkon 1 jádra bude už dneska +- stejnej ale síla bude a byla vždy o tom že je zpřáhnes víc.....

A co ja s tim mam delat? O nicem takovym se s tebou nehadam, ze vykon jader uz asi moc neporoste souhlasim

Citace:
jestli k tomu bude potřeba více nových instrukcí proc ne, nebo unifikovat více bloky v kterých jsou jádra, to nedovedu říct, ale už dneska jasně vím, že to co píšeš a popisuješ přestává platit.....

Platit nic z toho co pisu neprestava, novy instrukce ti nijak nepomuzou udelat z neparalelizovatelnyho algoritmu paralelizovatelnej. Maximalne ti to zlepsi pomer u toho druhyho bodu, kterej jsem nahore vypsal.
Ale na ten treti to nebude mit zadnej vliv.

Citace:
ten kdo bude chtít udržet krok bude vymýšlet SW tak aby šel využít právě na těchto platformách, budeli to znamenat opustit principy toho co se dneska považuje za standard tak vyhraje ten kdo to udělá jako první....

Vsak spousta softu, kde to je mozny a ma to smysl se uz dneska vicevlaknove pise.

Citace:
ten kdo bude chtít udržet krok bude vymýšlet SW tak aby šel využít právě na těchto platformách, budeli to znamenat opustit principy toho co se dneska považuje za standard tak vyhraje ten kdo to udělá jako první....

nic takovyho v dohlednu neni, zadna velka zmena se nechysta, neni k tomu zadnej duvod, vic vlaken muzes pohodlne vyuzivat i ted, pokud je to problem, kterej je smysluplne paralelizovatelnej.

Citace:
jo vim ze neco nejde a sám sem to v predchozích přízpěvcích psal, ale znovu ti tu píšu že to je o tom aby ty si vylezl ze svého omezeného myšlení a když ti něco schází nebo to ve tvém oboru nejde máš se zajímat o to jak to udělat jinak a třeba zkusit zabruslit i jinam....

omezenyho mysleni? co je omezenyho na tom, ze paralelizuju jen algoritmy, kde to ma smysl?
Být tebou bych nikam radši moc nezabrušoval, já se tu s tebou taky nebavím, o oblečení nebo nevím, v čem se vyznáš ty...
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 15:07:29
avatar
já ale netvrdím, že lze úplně všechno optimalizovat, jsem si ale jistý, že velkou část věcí, lze optimalizovat mnohem lépe než jak to je a neděje se tak zejména kvůli lenosti, dokud na to někdo neupozorní ... a možná i u těch věcí, které teď tvrdíte, že nejdou, tak to nemusí být pravda, třeba se o to ještě nikdo pořádně nepokusil a používá se něco, co a jak někdo udělal před 10-15ti lety a od té doby se to prostě kopíruje a kopíruje ...

znám spoustu programátorů, dobrých i špatných a vím, jak k práci a optimalizacím mnozí přistupují, stejně jako k dodržování standardů ... stojím si za tím, že zejména v současnosti je velká část programátorů a tzv. vývojářů SW jen přeplacenými flákači, protože si to za současných podmínek mohou dovolit .... a běda, když je někdo začne kritizovat ;)
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-07 17:20:14

Ono je to o tom, ze kdyz se pise program, tak na to musis jit pragmaticky, nemuzes nad kazdym radkem delat detailni analyzu rychlosti apod., protoze dneska programy maj bezne desitky tisic az milionu radku - proste vyberes algoritmus, co ti prijde optimalni (i v tom, kolik to da prace napsat) a napises to. Vykon se resi az kdyz je neco pomaly, podobne ve hrach - nejdriv se pise funkcnost, az pak optimalizujes, protoze obracene to nema moc smysl - muze nekdo prijit s pozadavkem neco pridat, ty to pridas a cely to muze bejt ve vysledku pomalejsi nez bez ty optimalizace, protoze ta funguje jen za urcitych podminek apod...

Fakt mam obcas pocit, ze si to predstavujete, jak Hurvinek valku
fagot [Zobrazit profil] [Poslat zprávu] 2018-08-07 17:33:48

Máte docela zkreslené představy, jak probíhá vývoj softu. SW architekt něco navrhne, rozdělí to na podprojekty, ty přidělí týmům, které mají vedoucího, který rozdělí práci programátorům. O tom, která část se bude paralelizovat se rozhoduje na úrovni návrhu, v horším případě na úrovni týmu. O tom, zda něco bude nebo nebude paralelizované tedy ve výsledku nikdy nerozhoduje programátor. Ten bouchá, co se mu přikáže. A je tedy zcela a naprosto jedno, zda je nebo není líný. Může být maximálně neschopný pobrat záludnosti paralelizace a vyrábí deadlocky nebo zabugovaný soft (paralelní věci se podstatně hůře debugují, zejména pokud problém nastává při určitém souběhu). Navíc tohle se ve škole naučit nedá, jsou k tomu zapotřebí určité vlohy a zkušenosti. Dokud se nenaučíme klonovat lidi včetně vědomostí, tak jsme v pasti :-p Nebo až bude softy psát AI ;-)
Objektiv [Zobrazit profil] [Poslat zprávu] 2018-08-07 17:46:35

Já bych řekl, že vy tomu pouze dostatečně nerozumíte.
fagot [Zobrazit profil] [Poslat zprávu] 2018-08-07 18:02:49

To je dost možné. Jsem v oboru přeci jen pouhých 24 let a návrh masivně paralelních aplikací (nejen mezi jádry ale i mezi nody clusteru) je mou specializací. Pak je ale problém, že stejným způsobem tomu nerozumí... všichni. A to neporozumění se vyučuje i dnes na školách. Takže musíte počkat až vyroste nová generace SW inženýru, která tomu porozumí, to bude nejdříve za 20 let ;-)
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 19:20:14
avatar
hmm pak se nabízí otázka, zda některé věci neděláte už ze zvyku, místo vymýšlení nových způsobů a radši budete trávit hodiny diskutováním o tom, že to prostě nejde a jak tomu nerozumíme ... také znám pár takových programátorů ;)

Tím se vás nechci dotknout, můžete být světlá výjimka, která se už snažila váš SW optimalizovat a vylepšit pro využití stávajících moderních API a vícejádrových CPU i moderních GPU ... a dávno využívá všech 32jader/64vláken, které současná CPU nabízejí a plně využívá všech aspektů DX12/VULKAN architektury VEGA atd.

Jen prostě vím, že spousta programátorů si žije ve svém světě a velmi neradi mění své zvyky a velmi neradi se učí novým věcem. Ignorace nových standardů je všudypřítomná a zejména u her AMD a NVIDIA mohou vyprávět, jak základní věci musí po vývojářích her opravovat, aby hry vůbec trochu běžely ...
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-07 22:26:07

AMD a NV po vývojářích něco opravují ve hrách? Odkdy? V jaké hře se něco takového někdy stalo?
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 22:59:21
avatar
v mnoha, odkud si myslíš, že se ty desítky % zlepšení výkonu, které AMD a NV dosáhnout proti vydání hry berou?
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 07:33:47

Víš, že jsem docela čekal, že přesně tenhle nesmysl napíšeš?

Optimalizace ovladačů pro danou hru totiž nemají nic společného s tím, že by NV/AMD opravovali hry po vývojářích, ti na ty hry vůbec nesahají.

AMD/NV pouze optimalizují samotný profil ovladače pro danou hru - upravují samotný ovladač, kam do kódu vývojář hry nemá přístup.
Bumpkin [Zobrazit profil] [Poslat zprávu] 2018-08-08 09:42:42

heh
ano pokud budeme brát staré hry bez podpory tak to platí že AMD a NV ladí jen ovladače atd...

Tady se ale budeme bavit spíše o hrách které mají i několik let veelkou podporu, přecejen každý vydavatel chce ze své značky dostat co nejvíce....

krásným důkazemjsou na příklad smlouvy na konzole kde je jasně stanoveno že v určitých intervalech musí studio vydávat minimálně udržovací aktualizace.... tedy ANO vývojáři HER dělají také velké opravy a úpravy... dokonce nemusíme ani chodit daleko přímo v ČR máme warhose studio a jejich AAA titul který ke dnešku měl šílené množství oprav které měli nemalý vliv na chod hry a na tom aby byla optimalizována!!!

no a pokud se podíváme ještě na leší ituly tak bych vám doporučoval se mrknout na evoluci world of tanks!! kde se dokonce hrabalo do enginu hry a šíleně se předělávala grafika

no a můžeme si vzít na paškál i nedávnou aktualizace a přechod WoW z DX11 na DX12... tedy vaše infomace o tom že se do hry nehrabe je totálně scestná!!!
Objektiv [Zobrazit profil] [Poslat zprávu] 2018-08-08 09:52:22

Ty jsi scestný on napsal, že do kódu hry nezasahuje nikdo z AMD nebo nvidie. Nauč se číst.
fotoba [Zobrazit profil] [Poslat zprávu] - Každý deň 2018-08-08 11:19:27

ex-inženýr Nvidie: Každou hru vydávají rozbitou, opravujeme to v driverech
11. 3. 2015

„Téměř každá hra je vydána rozbitá. Řeč je o významných AAA titulech od výrobců, kteří patří k nejznámějším v branži. Někdy řešíme i donebevolající porušení pravidel APU - jedna D3D9 hra se ani neobtěžovala s voláním BeginFrame/EndFrame. Leccos jsou chyby nebo přehlédnutí - jeden titul byl vydaný s chybnými shadery, které silně snížily výkon našich ovladačů. Takové záležitosti jsou na denním programu bug-trackeru. Pak se na to někdo podívá, zjistí, co je v té hře zvorané a vytvoří záplatu, aby si s tím ovladač poradil. V ovladači už existuje dlouhá řada volitelných záplat, které prostě pro jednotlivé hry zapínáme nebo vypínáme - a pak jsou tam hacky specifičtějšího rázu - až po kompletní náhradu původních shaderů za verzi připravenou našim softwarovým týmem."
https://diit.cz/clanek/bugy-ve-hrach-resi-ovladace-graficke-karty

To isté platí pre CPU kód s pohľadu kvality
Objektiv [Zobrazit profil] [Poslat zprávu] 2018-08-08 11:22:21

No čekal jsem kdy se zde tento komentář ukáže.
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 11:46:05

Chyby jsou v kazdym SW a vzdycky budou - at uz je to hra nebo aplikace.

Samozrejme je rozdil mezi tim, jestli je tam par chyb nebo hromada a samozrejme nekteri programatori jsou prasata nebo lidi, co danou cast programujou bez predchozich zkusenosti i ve velkych hrach, ale casto za to nemuzou ani samotni programatori, ale management - honi se terminy, nedaji programatorum ani cas danou vec poradne analyzovat a naprogramovat apod.

A co se uprav shaderu tyce, tam to jsou casto optimalizace pro konkretni GPU architekturu nebo konkretni cip, coz je neco, s cim by vyvojar hry travil dalsi mraky casu, ale pokud nema tunu zkusenosti primo s danym cipem, tak stejne je to ladeni trochu metoda pokus-omyl a nemusi se dobrat k optimalnimu vysledku, kterej pak dokaze clovek od NV/AMD.
Preci jen clovek, co pise kazdy den shadery pro konkretni cipy bude ty shadery psat mnohem lip a rychlejc.

Ono i tak casto vyvojari her pisou vic verzi, typicky treba AMD/NV, protoze kazdy sedi neco trochu lip a i kdyz si to asi nemyslite, tak optimalizace vykonu se u vetsiny her dela - pak je to jen o tom, najit ty spravny mista a hlavne kolik na to je casu - coz zase nezalezi na programatorech .
Barracudka [Zobrazit profil] [Poslat zprávu] - Rockstar 2018-08-07 18:01:13

Tak napr taky Rockstar by mohol nieco urobit s ich GTA V ktora zarobila miliardy dolarov takze tam sa nemaju naco vyhovarat aj keby to trvalo milion clovekohodin. aspon podla mna
maltrabob [Zobrazit profil] [Poslat zprávu] 2018-08-07 20:02:48
avatar
Citace:
nebo se to nevyplatí finančně (algoirtmus uděláme jednovláknový za 10 člověkodnů nebo vícevláknový za 500 člověkodnů
A sme doma. Ono by to slo ale stalo by to peniaze .
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 20:06:09
avatar
jasně, co je jim do zákazníků, ti to kupí tak jako tak protože nemají na výběr .... snažit se tak nemusí a místo toho si může šéf koupit další ferrari
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-07 22:42:41

A sme doma?
Tak si predstav ten pripad zezhora, kdy te jednovlaknovy reseni vyjde na 10 clovekohodin a vicevlaknovy na 500 clovekohodin, to te pri 500 Kc nakladech na programatora (ten z toho dostane na hodinu cca 250) vyjde na 40 000 Kc na jednovlaknovy a 2 000 000 Kc na vicevlaknovy.

Takze myslis, ze se to ve hre vyplati, kdyz budou tohle dilema rozhodovat treba 20x v ty hre? To uz mas 20 x 40 000 vs 20 x 2 000 000 - tedy 800 000 vs 40 000 000 Kc, to uz si rozmyslis, jestli ti to stoji za to.

+ navic dneska ve vetsine her te stejne brzdi grafika, takze ti to stejne ve vysledku zadny fps navic neprinese nebo max par procent, v lepsim pripade treba par desitek. Ale za cenu treba i znasobeni ceny cely hry a ne vsichni si muzou nejaky zvysovani nakladu dovolit.
aDDmin [Zobrazit profil] [Poslat zprávu] 2018-08-07 22:58:37
avatar
Všichni určitě ne, ale pro většinu velkých jsou to drobné ...
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 07:35:38

Pokud si tohle myslíš, tak proti tomu už argumenty nemám, snad jen zajdi si někdy do nějaké SW firmy popovídat s někým, ideálně asi s nějakým manažerem o tomhle .
Phosgore [Zobrazit profil] [Poslat zprávu] 2018-08-08 08:20:23

Zejména u profi programů není časová náročnost na naprogramování validním argumentem. Nějká rychlokvaška hra, která tu s námi bude půl roku budiž, ale soft, který se používá dennodenně a bude tu s námi ještě hodně dlouho (byť v dalších verzích) má být optimalizovaný zcela maximálně.
To, že by na to vývojář musel dát 100x tolik času je jen malou daní za to, že to pak desetitisícům lidí bude běhat denně rychleji. A v profi sféře je soft zaplacený a defakto si někteří můžou říct, co chtějí a stejně to dostanou. Pro mě je "neoptimalizace" některých softů zcela frustrující.

No nic, z DDho arguemntů ale sdílím přesvědčení o tom, že je někde někdo hodně líný (a nebo lakomý) a jede metodou hlavně se s tím nesrat, protože nefakturujeme v hodinovce. A u pracovního dlouhodobě vyvíjeného softwaru bych prostě čekal, že všude kde to půjde někdo paralelizaci implementuje.
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 11:27:05

j, pokud je to treba rendering, tam samozrejme po tom sahnes, protoze ti kazdy jadro prida hodne vykonu navic a to bude pouzivat hodne lidi a ani to nejspis nebude tak komplikovany to implementovat, ale treba prave u tech her se ti nebude chtit zvysovat komplexitu a tim vyslednou cenu treba dvojnasobne, kdyz to ve vysledku stejne bude brzdit hlavne grafika a vykon stoupne jen o par fps.

Ono momentalne i vetsina SW, co je nejak vic rozsirena a da se tam nejak efektivne napsat multithreading, tak uz to pouziva - renderery, en/decoding videa, komprese apod., kde vim, ze by to mohlo byt a neni jsou treba ruzny graficky filtry do nekterych grafickych programu, tam by se to casto dalo hodne zlepsit a taky by vetsina tech filtru mela jit prepsat celkem jednoduse.
maltrabob [Zobrazit profil] [Poslat zprávu] 2018-08-07 23:03:11
avatar
No, ved ono sa najdu firmy ktore budu mat k tomu iny pristup a pre tych starych dinosaurov bude platit "Kdo chvíli stál, již stojí opodál". Na trhu to tak chodi, najde sa medzera a niekto ju vyplni. Inej cesty niet, frekvencie do nekonecna neporastu a tak sa bude musiet optimalizovat na dostupny hardware.
fotoba [Zobrazit profil] [Poslat zprávu] - Byť Vami argumentujem inak 2018-08-08 11:55:47

>proč některé věci principiálně paralelizovat nelze


>nebo se to energeticky nevyplatí


>Amdahlova zákona

Skôr by som sa pozeral na Gusatafsonov zákon, lebo to je v podstate revízia Amdahla a lepšie edí pre prípad manuálnej nie strojovej paralelizácie ako Amdahl

Tie grafy na wiki laikovi pri Amdahlovi nič nepovedia.


Ak by som mal niečím argumentovať laikom, tak to bude OSbench

https://www.phoronix.com/scan.php?page=article&item=dell-xps-os&num=5

A tým , že createthread niečo stojí a pomerne mnoho
12-60 mikrosekúnd je k 0,25 ns na jednoduchú inštrukciu v x86. 48 000 až 240 000 viac a tak síce každá úloha je paralelizovateľná ale ak sa budeme baviť o vlákne/procese s 10 000 inštrukciami, tak bude výsledkom paralelizácie výrazné spomalenie, nie zrýchlenie.

A zistiť, kde sa paralelizácia oplatí je celkom veľký problém

+ výmena dát medzi threadmi procesmi je +/- taká pomalá ako alokácia RAM


Keby to bolo jednoduché tak táto praktická príručka

Is Parallel Programming Hard, And, If So, What Can You Do
About It?
Edited by:
Paul E. McKenney
Linux Technology Center
IBM Beaverton
paulmck@linux.vnet.ibm.com
January 2, 2017

nemá 477 strán
https://mirrors.edge.kernel.org/pub/linux/kernel/people/paulmck/perfbook/perfbook.2017.01.02a.pdf


a v výsledku to nie je priekak , aký je


Parallel programmers not prepared for the glorious revolution
By Wily Ferret
Tue Nov 27 2007, 12:28

INTEL RECKONS barely one per cent of software programmers are prepared to face the challenge of parallel programming, which the hardware giant (unsurprisingly) reckons is the future of development.
http://www.theinquirer.net/inquirer/news/1026585/programmers-prepared-glorious

If only one percent of pragrammers is able to do so, it may be hard.

And is was not changed since that time till today

Software needs meaty cores, not thin, stringy ARMs, says Intel
By Simon Sharwood, 26 Feb 2014

“The world has a big issue around vectorisation and parallelisation of code,” Graylish said. “99% of code isn't written that way.” Graylish also feels “defining a workload that can run in 1000 cores is hard.”

Most software, Graylish added, “still requires a big meaty core” and Intel is happy to provide them.
http://www.theregister.co.uk/2014/02/26/ software_needs_meaty_cores_not_thin_stringy_arms_s ays_intel/
trnkaj [Zobrazit profil] [Poslat zprávu] 2018-08-08 12:12:32

Tak samotny createthread se da vetsinou resit threadpoolem, kdy se ta rezie o neco zmensi, i kdyz tam porad samozrejme je.

Vetsi problem ohledne casu vidim v synchronizaci vlaken, protoze vic vlaken nemuze zaroven pristupovat na jedno misto pameti, pokud tam muze v danou chvili i nekdo zapisovat a nejedna se o atomickou operaci (takze napr. operace nad std::vector), takze pokud to jsou nejake slozitejsi operace, kde se casto zapisuje a cte do nejakeho spolecneho mista, tak se klidne muze nakonec stat, ze se travi spousta casu cekanim na uvolneni kriticke sekce a vykon se nezvedne nebo dokonce i klesne.
Oldis [Zobrazit profil] [Poslat zprávu] 2018-08-07 16:38:12

No zase dodám že nepotřebuju aby všechny aplikace používali zároveň všechna jádra. Aplikací mám puštěných dost a tak mi stačí když každá umí tak 2-4 vlákna a tedy se navzájem nehádají o procesorový čas. Ale taky už bych chtěl do ntb alespoň těch 16 jader, na virtualizaci.
Kubajsz [Zobrazit profil] [Poslat zprávu] 2018-08-08 11:10:21

Strasne cist nektere komentare.
Cim vyssi DigiAura, tim mensi vseobecny prehled a zaslepenost.
Oldis [Zobrazit profil] [Poslat zprávu] 2018-08-08 20:11:06

menší přehled a menší zaslepenost?
archecon [Zobrazit profil] [Poslat zprávu] - Tak taky nějaké užitečné info 2018-08-19 18:11:23

https://bitmovin.com/av1/

No AV1 je 1000 pomalejší při encodingu než H265. Ale implementace nového videoformátu běží dost rychle. AMD, NVIDIA, INTEL NETFLIX, Amazon, Cisco na tom pracují. Tak kdyby snad měl někdo pochyby nač vlastně vícejádrové procesory. Jo a k debatě: vzpoměl jsem si na Cinema Craft Encoder byl pozoruhodný v tom, že uměl realtime encoding už na starých plečkách díky napsané části kodu v přímo ve strojaku . (To pro programátory tady. ) Ale hlavně jejich profi kodek na H265 vyžaduje nejméně dvou procesorové stroje MINIMALNE! s 2x8 jádrovými Xeony a to prosím už v roce 2015. Asi jim to škáluje lépe než X265.Že by zase vypiplaný kod? No za ty statisíce co za to chtějí..na dotaz.. Tak asi tak.
Pouze registrovaní uživatelé mohou přidat komentář!