Diit.cz - Novinky a informace o hardware, software a internetu

Mohou být úvahy o výkonu RDNA 3 chybné?

Útržkovité informace a spekulace na téma specifikací a výkonu čipů postavených na architektuře RDNA 3 si vzájemně odporují. Kde mohli udělat soudruzi z NDR chybu?

Stávající mediální konsensus, pokud jde o výkon a parametry nadcházejících grafických architektur, je asi takový, že RDNA 2 v podobě Navi 31 cílila na o něco vyšší výkon než Lovelace v podobě AD102. Nvidia se proto rozhodla zvýšit výkon nastavením vyšší taktů (a mírným zvýšením počtu aktivních výpočetních jednotek v rámci GeForce RTX 4090), což vedlo i ke zvýšení energetických nároků. Výsledkem by mělo být, že se výkon obou řešení nebude dramaticky odlišný.

Problém je, že tyto projekce výkonu nejsou v souladu se známými parametry. V poslední době se začaly objevovat informace o ±finálních taktech GeForce RTX 4090, což kompletuje údaje o obou top-produktech nové generace. Na jejich srovnání ale cosi nesedí.

Vyjděme u parametrů stávajícího hardwaru (budeme brát v potaz obvyklé taktovací frekvence, tedy Game Clock pro AMD a Boost pro Nvidii). Radeon RX 6900 XT je vybaven 5120 stream-procesory na 2015 MHz. Což odpovídá aritmetickému výkonu 20,6 TFLOPS. GeForce RTX 3090 je vybavena 10496 stream-procesory na 1695 MHz, což odpovídá 35,6 TFLOPS. Celkový herní výkon je při těchto parametrech zhruba srovnatelný (drobné rozdíly jsou z hlediska následujícího srovnání nepodstatné).

Radeon RX 7900 XT (či jak se top-model postavený na GPU Navi 31 bude jmenovat) ponese 12288 stream-procesorů a běžet má na 3050 MHz. GeForce RTX 4090 má nabídnout 16384 stream-procesorů a takt 2520 MHz. Tím se dostáváme k 75,0 TFLOPS pro Radeon a 82,6 TFLOPS pro GeForce. Sama o sobě nám tato čísla nic neřeknou. Všimněte si ale mezigeneračního srovnání. Zatímco u Radeonu se při 20,6 TFLOPS → 75,0 TFLOPS dostáváme mezigeneračně na 3,6násobek aritmetického výkonu, u GeForce se při 35,6 TFLOPS → 82,6 TFLOPS dostáváme mezigeneračně na 2,3násobek aritmetického výkonu.

Jednoduše a krátce: Pokud máme nyní na trhu dva výkonnostně srovnatelné produkty a jednomu zvýšíme výkon 3,6× a druhému 2,3×, nemohou být výsledkem opět dva výkonnostně srovnatelné produkty. Něco zde tedy nesedí a to poměrně značně.

Pokud nebudeme předpokládat, že Radeon RX 7900 XT bude nějakým zázrakem o >50 % rychlejší než GeForce RTX 4090 (a přitom mít ještě podstatně nižší spotřebu), pak musíme hledat důvody jinde a to v mezigeneračních změnách architektury. Předpokládá se, že Nvidia zvýší využitelnost aritmetických jednotek, takže herní FPS na FLOP bude mírně vyšší než u současné generace. Těžko však půjde o posun o podstatně více než o ~10 %, abychom tím mohli vysvětlovat ~50% rozpor ve výkonu.

Je tedy potřeba hledat na straně Radeonu, respektive RDNA 3. Zdá se totiž, že většina leakerů má přístup ke správným parametrům čipu, ale je možné, že tyto parametry chybně interpretují. Počet stream-procesorů mezigeneračně zvýšil z 5120 na 12288. Většina leakerů (či jejich zdrojů) z toho automaticky vyvozuje, že tím dojde k (12288/5120) 2,4násobnému zvýšení výkonu (+nárůst taktů). Tento výpočet však stojí na předpokladu, že stejnou měrou jako počet stream-procesorů stoupne i počet dalších jednotek, které se na herním výkonu podílejí, to znamená texturovacích jednotek a ROP.

Jenže to jednak dosud nebylo potvrzeno a jednak při tomto předpokladu vychází onen mezigenerační posun z říše pohádek (3,6×, viz tučný odstavec výše). Není tedy možné, že AMD u RDNA 3 přistoupila k podobnému kroku jako Nvidia u generace Ampere a zdvojnásobila poměr aritmetických jednotek ku texturovacím?

Připomeňme, že Turing disponoval 16 aritmetickými jednotkami (stream-procesory) na texturovací jednotku (GeForce RTX 2080 Ti měla 4352 aritmetických jednotek a 272 texturovacích jednotek), přičemž Ampere poměr zvýšil na 32 aritmetických na jednu texturovací jednotku (pro GeForce RTX 3090 je to 10496 a 328). Pokud by AMD viděla důvod k podobné úpravě, znamenalo by to, že se z 5120 aritmetických jednotek a 320 texturovacích jednotek u současné Navi 21 (RDNA 2) neposuneme u Navi 31 na 12288 aritmetických a 768 texturovacích jednotek, ale na 12288 aritmetických a 384 texturovacích jednotek.

 GeForce
RTX 2080 Ti
GeForce
RTX 3090
GeForce
RTX 4090
Radeon
RX 6900 XT
Radeon
RX 7900 XT
archit.TuringAmpereLovelaceRDNA 2 RDNA 3
SP43521049616384512012288
TMU272328512320768 384?
poměr SP:TMU16:132:132:116:116:1 32:1?

To by znamenalo, že mezi Navi 21 (Radeon RX 6900 XT) a Navi 31 (Radeon RX 7900 XT) sice mezigeneračně stoupne (se započtením taktovacích frekvencí) aritmetický výkon 3,6×, ale texturovací výkon se zvýší jen 1,8×. Jak se vyvine fillrate, zatím nevíme, protože není znám počet ROP.

Popsaná konfigurace by daleko více zapadala do zpráv o podobném výkonu obou konkurenčních produktů a jejich očekávané spotřebě. Tedy o mezigeneračním posunu podstatně blíže dvojnásobku než trojnásobku.

Diskuse ke článku Mohou být úvahy o výkonu RDNA 3 chybné?

Úterý, 19 Červenec 2022 - 09:13 | FyBy | Zkráceně. Autor předpokládá, že amd udělá něco...
Pondělí, 11 Červenec 2022 - 12:22 | Ladis | Až na to, že procházení stromu scény je...
Pondělí, 11 Červenec 2022 - 11:28 | no-X | GeForce RTX 4090 oproti GeForce RTX 3090 zvýší...
Pondělí, 11 Červenec 2022 - 11:23 | Peter Fodrek | A potom tu údajná "Navi30" s 2x GDC a...
Pondělí, 11 Červenec 2022 - 10:28 | Mike123 | V čem že beru jistotu? Že nějaká GPU postavená s...
Pondělí, 11 Červenec 2022 - 10:16 | Peter Fodrek | Ono sa píše, že new RT, teda, že sa RT robí inak...
Pondělí, 11 Červenec 2022 - 10:13 | Tom Buri | az na to ze se pouzivaj texturovaci jednotky..
Pondělí, 11 Červenec 2022 - 10:12 | Tom Buri | kde beres tu jistotu? jesli se potvrdi, co je v...
Pondělí, 11 Červenec 2022 - 10:06 | Mike123 | Můžeš si být jistý, že minimálně full fat N31...
Pondělí, 11 Červenec 2022 - 10:01 | Peter Fodrek | Ja by som skôr veril tomu, že AMD bude robiť...

Zobrazit diskusi