Diit.cz - Novinky a informace o hardware, software a internetu

GigaThread Thread Scheduler

Nvidia Fermi logo (jako)
Kalifornská Nvidia právě v tuto chvíli oficiálně uvolňuje informace o chystané nové (nejen DirectX 11) generaci GPU, o které jsme doposud psali jako o GT300. Její krycí jméno je Fermi a rovnou si řekněme: jde o malou revoluci ve stylu, s jakým přišlo GPU G80 na GeForce 8800. Pojďme se tedy společně podívat, co Nvidia právě ve svých laboratořích a ve spolupráci s TSMC usilovně finišuje, co hodlá postavit proti Radeonům a FireGL/FireStream kartám generace HD 5800 a čím hodlá zatopit pod kotlem nejen AMD, ale i Intelu. Architektura nové generace Nvidia čeká na své představení…

Krátce ještě k novému plánovači. Dvouúrovňový distribuovaný plánovač ve Fermi je další klíčovou částí návrhu GPU. Na úrovni křemíku plánuje globální distribuční engine přidělování jednotlivých bloků threadů na různé SM jednotky, na úrovni SM pak každý warp plánovač distribuuje warpy 32 threadů na své vykonávací jednotky (stream procesory) uvnitř svého SM. První generace GigaThread engine uvedená na G80 zvládala spravovat až 12 288 threadů v reálném čase. Fermi staví na tomto základě poskytováním nejen vyšší "hrubé síly", ale také dramaticky rychlejším přepínáním obsahu, souběžným vykonáváním kernelů a vylepšeným plánováním bloků threadů.

10× rychlejší přepínání aplikačního obsahu

Multitasking je pochopitelně nezbytný i na GPU a i zde se, stejně jako na CPU, řeší přepínáním obsahu. Jde o to udělat vše co nejrychleji, aby ztráty z této režie byly minimální. Fermi pipeline je optimalizována za takovým účelem, přepnutí obsahu umí v časovém intervalu 10 až 20 µs. Díky tomu mohou programátoři využívat ve větší míře jen s minimální ztrátou výkonu GPU mezikernelovou komunikaci jako třeba kooperaci mezi grafickou a PhysX částí aplikace.

Souběžné vykonávání kernelů

Nvidia představila Fermi: souběžné vykonávání kernelů

Fermi podporuje souběžné vykonávání kernelů v tom smyslu, že v daném časovém úseku lze s jedním kernelem počítat hned další (a další a další &hellip) a je tak využita plná výpočetní kapacita, tedy vytíženo celé GPU na maximum. Například ve fyzice lze počítat kernely řešící chování kapaliny a současně i interakci pevných těles, které by, pokud by byly vykonávány až po sobě, využily jen polovinu volných thread procesorů. Na architektuře Fermi mohou být různé kernely téhož CUDA obsahu vykonávány společně. Kernely z různých aplikačních obsahů mohou nadále běžet sekvenčně, ale i ty pochopitelně těží z rychlejšího přepínání obsahu.

David "David Ježek" Ježek

Bývalý zdejší redaktor (2005-2017), nyní diskusní rejpal.

více článků, blogů a informací o autorovi

Diskuse ke článku Nvidia představila novou architekturu Fermi

Neděle, 4 Říjen 2009 - 09:01 | mukade | ja som zvedavy na larrabee, ci zamuti stojate...
Pátek, 2 Říjen 2009 - 12:00 | Anonym | Charlie Demerjan pátrá, radí, informuje: http://...
Pátek, 2 Říjen 2009 - 08:38 | Anonym | ba te prezentaci byla ukazovana jenom maketa...
Pátek, 2 Říjen 2009 - 08:26 | Anonym | až to uvidím tak to posoudím, ale marketing maj...
Pátek, 2 Říjen 2009 - 08:25 | Mad MaxII | >>David: Omluva, vy jste to nikde...
Pátek, 2 Říjen 2009 - 07:43 | Mad MaxII | >>David: Pane redaktore, s tim ze...
Čtvrtek, 1 Říjen 2009 - 22:23 | Anonym | Neklesly akcie nVidie protože pořád hlásala, že...
Čtvrtek, 1 Říjen 2009 - 21:27 | qee | Bezva článek, díky. Jinak bych si tipnul, že...
Čtvrtek, 1 Říjen 2009 - 20:12 | Anonym | Fermi ma vela veci ktore sa budu dat pouzit v...
Čtvrtek, 1 Říjen 2009 - 19:51 | Anonym | Osobně si myslím, že hardwarově nebude mezi...

Zobrazit diskusi