Diskuse k Nová architektura GPU od AMD dostává konkrétnější rozměr

Hkr ptr | 21. 6. 2011 - 00:21

Opět kvalitní článek. Bravo, tleskám.

terrorist | 21. 6. 2011 - 02:32

"Nová L1 cache je unifikovaná (slouží pro data i textury - na rozdíl od Caymanu a Fermi), .."

fermi ma unifikovanou cache. ovsem kvuli zachovani kompatibility se starymi GPGPU aplikacemi muze fungovat take jako u GT200, pokud je to potreba

"NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications."

no-X | 21. 6. 2011 - 09:13

Fermi má sdílenou L1 data cache s LDS (shared memory), ale texture cache je stále samostatná (12kb na quad).

terrorist | 21. 6. 2011 - 10:07

zrejme neumis cist tu citaci, kterou jsem tam vlozil. to plati i pro machinu. zamerte se hlavne na posledni vetu. 12KB mela predchozi generace. to je prave ta pointa. souckovi to jaksi uniklo, ale ani jsem necekal, ze by to priznal. bude se vykrucovat ..

no-X | 21. 6. 2011 - 10:47

Nevím, o co ti jde :-) Zkusím to polopaticky. Fermi MÁ stále 12kb samostatné texture cache na quad. Fermi NEMÁ sdílenou texture cache s data cache. Fermi MÁ pouze sdílenou data cache s LDS (shared memory). Citace z AT, kterou jsi sem dal, vyznívá dost nejednoznačně. G80, GT200 i GF100 mají všechny 12kb L1 samostatné texture cache na quad. A tato L1 TC je v případě GF100 stejně nepoužitelná pro CUDA aplikace, jako tomu bylo u GT200 a G80.

terrorist | 21. 6. 2011 - 10:55

to, ze to vyzniva nejednoznacne, je ciste tvuj nazor. v tom clanku je jednoznacne napsano, ze je ted v kazde SM 64kB cache, ktera muze fungovat jako plnohodnotna L1 cache. v compatibility modu pro starsi cuda plikace muze byt cache rozdelena na tu "tvoji" sdilenou pamet a prave l1 cache. ale pokud SM nebezi v compatibility modu, funguje to presne, jak bude ta pamet fungovat v GCN. opravdu nechapu, co je na tom k nepochopeni a nejasne

no-X | 21. 6. 2011 - 11:18

Tak ještě jednou :-) Fermi sdílí L1 DATA cache s LDS (celkem 64kb na SM). L1 TEXTURE cache je zcela samostatná, nijak s těmito 64kb nesouvisí a její kapacita je 12kb na každý quad.

terrorist | 21. 6. 2011 - 11:25

"bude se vykrucovat .. "

no-X | 21. 6. 2011 - 11:48

Mohl bys napsat, o co ti jde? :-) Není mi jasné, z čeho se podle tebe vykrucuju - vše, co jsem napsal je tak, jak jsem to napsal. Spíš mi přijde, že dost dobře nevíš, o čem mluvíš. Ve 12kb cache na GT200 není žádná pointa, 12kb L1 TC na TMU quad mají všechny generace: G80, GT200 i GF100. Možná si pleteš L1 data cache s L1 texture cache, ale to v případě Nvidie jsou a byly dvě odlišné věci. Zkus si ještě jednou přečíst, co jsem ti tu napsal :-)

terrorist | 21. 6. 2011 - 23:27

nepletu. u fermi je to prave jinak. to co tvrdis ty je blabol. uz to, ze jsi oznacil text ryana smitha za nejednoznacny napovida, ze tim, co rikas si absolutne nejsi jisty. ja budu radeji verit jemu, nez tobe. zmena memory managementu na nejnizsi urovni je jednou ze zakladnich premis architektury tvorene pro GPGPU. zrejme te stve, ze amd svym konceptem GCN "uznala" principy fermi jako spravne, protoze i pres rozdilne low-level implementace jde ze strany amd o ty same principy, ktere prinesla fermi. ale ani -50 od tvych amd dronu, kteri te bezmyslenkovite nasleduji, z toho, co jsi napsal do clanku, neudela pravdu :)

ASD_SK | 22. 6. 2011 - 09:37

Preco si ten odstavec co si uviedol na zaciatku nepridal cely? "NVIDIA’s GT200 had a 16KB shared memory in each SM. This didn’t function as a cache, it was software managed memory. GF100 increases the size to 64KB but it can operate as a real L1 cache now. In order to maintain compatibility with CUDA applications written for G80/GT200 the 64KB can be configured as 16/48 or 48/16 shared memory/L1 cache. GT200 did have a 12KB L1 texture cache but that was mostly useless for CUDA applications. That cache still remains intact for graphics operations." Ta posledna veta jasne hovori, ze ta 12kilova cache tam je. To ta tak strasne bavi potahovat si triko, ze sa budes ohanat neuplnim textom? Daj odkaz na text, kde je napisane, ze je zjednotena cache pre data a textury. Alebo tu prestan spamovat ak nemas ziadny argument.

no-X | 22. 6. 2011 - 12:45

Díky, ale já už přestávám věřit, že se to snaží pochopit. Tohle je evidentní projev trola :-)

MACHINA | 21. 6. 2011 - 10:00

ehm, asi je dobré být si nejdříve jistý tím co říkám, než někoho začnu opravovat, pak totiž vypadám jako idiot ;-)

terrorist | 21. 6. 2011 - 10:07

ditto

Ondar | 21. 6. 2011 - 10:13

Už se těším - minulou "generaci" jsem přeskočil, na tuhle nejspíš přejdu (uvidíme podle recenzí výsledného produktu) - zatím to vypadá hodně zajímavě :-P

mikeczcom | 21. 6. 2011 - 14:55

taktéž to tak vidím. nebo si počkám na bulldozer "2" a nástupce GCN, pokud teda se nebudou v té době prodávat malé krabičky připojované na cloud servery....

webwalker | 21. 6. 2011 - 12:36

Asi ještě není známo jakého typu ta skalární jednotka bude, ale není jedna skalární jednotka oproti 4 vektorovým SIMDs v CU v nepoměru?

kyo kyo | 21. 6. 2011 - 15:22

Essential on our road to the Holodeck. To mi roztáhlo koutky. Držím palce AMD ! :)

Pro psaní komentářů se, prosím, přihlaste nebo registrujte.

Diit.cz - Novinky a informace o hardware, software a internetu

Diskuse k Nová architektura GPU od AMD dostává konkrétnější rozměr

Komerční sdělení

CDR Hry

PS5 umožní pozvání hráče přes mobilní aplikaci

NASA odmítá kritiku a tvrdí, že zpráva generálního inspektora je zbytečná

Snapchat dovolí upravit překlepy v chatu, ale jen do 5 minut

Evropská komise pod palbou kritiky: Utajování plánů na prolomení šifer

Nová funkce Memory způsobila průlom: ChatGPT Plus získá „pamatováka“

Aktuálně z blogů

KOMENTÁŘ: Jak se žije s „neomezenými“ daty za 29 Kč?

SockaPC 2023, dějství druhé

SockaPC a SockaPhone 2023 (ani na to neklikejte)

Pár slov k Socka PC 2022+

Komentář k testu 5800X3D s RX 6900 XT