Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Nová architektura GPU od AMD dostává konkrétnější rozměr

Opět kvalitní článek. Bravo, tleskám.

+1
+1
-1
Je komentář přínosný?

"Nová L1 cache je unifikovaná (slouží pro data i textury - na rozdíl od Caymanu a Fermi), .."

fermi ma unifikovanou cache. ovsem kvuli zachovani kompatibility se starymi GPGPU aplikacemi muze fungovat take jako u GT200, pokud je to potreba

"NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications."

+1
-1
-1
Je komentář přínosný?

Fermi má sdílenou L1 data cache s LDS (shared memory), ale texture cache je stále samostatná (12kb na quad).

+1
-3
-1
Je komentář přínosný?

zrejme neumis cist tu citaci, kterou jsem tam vlozil. to plati i pro machinu. zamerte se hlavne na posledni vetu. 12KB mela predchozi generace. to je prave ta pointa. souckovi to jaksi uniklo, ale ani jsem necekal, ze by to priznal. bude se vykrucovat ..

+1
+1
-1
Je komentář přínosný?

Nevím, o co ti jde :-) Zkusím to polopaticky. Fermi MÁ stále 12kb samostatné texture cache na quad. Fermi NEMÁ sdílenou texture cache s data cache. Fermi MÁ pouze sdílenou data cache s LDS (shared memory). Citace z AT, kterou jsi sem dal, vyznívá dost nejednoznačně. G80, GT200 i GF100 mají všechny 12kb L1 samostatné texture cache na quad. A tato L1 TC je v případě GF100 stejně nepoužitelná pro CUDA aplikace, jako tomu bylo u GT200 a G80.

+1
-1
-1
Je komentář přínosný?

to, ze to vyzniva nejednoznacne, je ciste tvuj nazor. v tom clanku je jednoznacne napsano, ze je ted v kazde SM 64kB cache, ktera muze fungovat jako plnohodnotna L1 cache. v compatibility modu pro starsi cuda plikace muze byt cache rozdelena na tu "tvoji" sdilenou pamet a prave l1 cache. ale pokud SM nebezi v compatibility modu, funguje to presne, jak bude ta pamet fungovat v GCN. opravdu nechapu, co je na tom k nepochopeni a nejasne

+1
+1
-1
Je komentář přínosný?

Tak ještě jednou :-) Fermi sdílí L1 DATA cache s LDS (celkem 64kb na SM). L1 TEXTURE cache je zcela samostatná, nijak s těmito 64kb nesouvisí a její kapacita je 12kb na každý quad.

+1
0
-1
Je komentář přínosný?

"bude se vykrucovat .. "

+1
-1
-1
Je komentář přínosný?

Mohl bys napsat, o co ti jde? :-) Není mi jasné, z čeho se podle tebe vykrucuju - vše, co jsem napsal je tak, jak jsem to napsal. Spíš mi přijde, že dost dobře nevíš, o čem mluvíš. Ve 12kb cache na GT200 není žádná pointa, 12kb L1 TC na TMU quad mají všechny generace: G80, GT200 i GF100. Možná si pleteš L1 data cache s L1 texture cache, ale to v případě Nvidie jsou a byly dvě odlišné věci. Zkus si ještě jednou přečíst, co jsem ti tu napsal :-)

+1
+1
-1
Je komentář přínosný?

nepletu. u fermi je to prave jinak. to co tvrdis ty je blabol. uz to, ze jsi oznacil text ryana smitha za nejednoznacny napovida, ze tim, co rikas si absolutne nejsi jisty. ja budu radeji verit jemu, nez tobe. zmena memory managementu na nejnizsi urovni je jednou ze zakladnich premis architektury tvorene pro GPGPU. zrejme te stve, ze amd svym konceptem GCN "uznala" principy fermi jako spravne, protoze i pres rozdilne low-level implementace jde ze strany amd o ty same principy, ktere prinesla fermi. ale ani -50 od tvych amd dronu, kteri te bezmyslenkovite nasleduji, z toho, co jsi napsal do clanku, neudela pravdu :)

+1
+1
-1
Je komentář přínosný?

Preco si ten odstavec co si uviedol na zaciatku nepridal cely? "NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications. That cache still remains intact for graphics operations." Ta posledna veta jasne hovori, ze ta 12kilova cache tam je. To ta tak strasne bavi potahovat si triko, ze sa budes ohanat neuplnim textom? Daj odkaz na text, kde je napisane, ze je zjednotena cache pre data a textury. Alebo tu prestan spamovat ak nemas ziadny argument.

+1
0
-1
Je komentář přínosný?

Díky, ale já už přestávám věřit, že se to snaží pochopit. Tohle je evidentní projev trola :-)

+1
+1
-1
Je komentář přínosný?

ehm, asi je dobré být si nejdříve jistý tím co říkám, než někoho začnu opravovat, pak totiž vypadám jako idiot ;-)

+1
+2
-1
Je komentář přínosný?

ditto

+1
+1
-1
Je komentář přínosný?

Už se těším - minulou "generaci" jsem přeskočil, na tuhle nejspíš přejdu (uvidíme podle recenzí výsledného produktu) - zatím to vypadá hodně zajímavě :-P

+1
-2
-1
Je komentář přínosný?

taktéž to tak vidím. nebo si počkám na bulldozer "2" a nástupce GCN, pokud teda se nebudou v té době prodávat malé krabičky připojované na cloud servery....

+1
0
-1
Je komentář přínosný?

Asi ještě není známo jakého typu ta skalární jednotka bude, ale není jedna skalární jednotka oproti 4 vektorovým SIMDs v CU v nepoměru?

+1
0
-1
Je komentář přínosný?

Essential on our road to the Holodeck. To mi roztáhlo koutky. Držím palce AMD ! :)

+1
-1
-1
Je komentář přínosný?

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.