PCDVD數位科技討論區 - INQ：NV40/45與G70可以支援2GB記憶體

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)

- 顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)

- - INQ：NV40/45與G70可以支援2GB記憶體 (https://www.pcdvd.com.tw/showthread.php?t=561045)

引用:

作者ccyew

看不是很懂^^;

以目前SLI的情況應該就是完全映射的做法，不過之前看過一篇文章是指說新的SLi技術可以使兩張卡的記憶體變成256+256=512，而不是256copy256還是=256

那篇......找不到....OTL

總之，現在就看nV怎麼玩接下來的顯卡設計了^^;

PS. 8個顆粒就可以上1G的記憶體......很貴吧><

你在找這篇嗎？

Private addressing in a multi-processor graphics processing system

主要內容是說，SLI本身最初的規格就已經具有NUMA能力了。

-----
說實話，我覺得是實體連接1GB、SLI private 定址兩張是最有可能的；其次是Bank interleave接更多顆DRAM，或者是"定址能力有、留待未來更大容量記憶體顆粒"，不過最後一項與"已有支援如此容量之產品出貨"不符。
以我的想法，這篇新聞如果不是"單顆"NV40/45 & G70可以上2GB，那就沒有意義了。
因為目前上述的幾個晶片並不存在足夠大的bus可以作為有效的NUMA之用：
SLI MIO-port只有1GB/s，太小。
靠雙PCIe 16x也只能確保2.1GB/s雙向，和卡上動輒30~40GB/s的頻寬相比，要作為NUMA過於勉強。
事實上，SLI會不啟動NUMA、而以目前會損耗記憶體容量的結構來運作，顯然就是因為不存在足以支撐NUMA的BUS所致的。

引用:

作者stratos2005

如果要用UMA的方法管理，gpu彼此溝通的速度必須非常快
我覺得有點難.....因為gpu對記憶體頻寬要求大於cpu很多
而cpu就算是amd採用的ht的crossbar也只有6.4gbps
這對處理器來說也許夠了，但是對gpu來說就相當的慢
例如K8 2 Way處理器採用UMA定址，記憶體頻寬馬上變成一半
就算用Node Interleaving，能補回20%的頻寬就相當不錯了

我不知道gpu上會不會有比較完美的方式可以做
cpu上面的uma或numa，不管哪種方式，都沒有記憶體的浪費
gpu採numa，我猜想他根本用完全映射
來達成最高的頻寬，gpu交換的資料也降到最低
但是也造成了大量的記憶體浪費

要不要把htt規格複習一下?
HyperTransport

HyperTransport

HyperTransport

引用:

作者艾克萊爾

要不要把htt規格複習一下?
HyperTransport (http://www.aopen.com.tw/tech/techin...erTransport.htm)

HyperTransport (http://www.eedesign.com.tw/article/...erTransport.htm)

HyperTransport (http://www.digitimes.com.tw/n/artic...825700E0046F86F)

嗯..複習了..但是..不懂為何要複習
您給的每個連結，都是寫這樣
Bandwidth(Each Direction) 100 to 6500 Mbytes/sec
6500mbps是32bit連結的版本，目前沒有任何實物
只是有規範，而htt當然有制訂更高的規格
目前Opteron有使用的就是16bit with的3.2gbps版本
所以雙向是6.4gbps，這就是一般在用的模式
5 bits的規格事實上某些Opteron上搭配主機板也可以做
那也就是將6.4gbps提高到8gbps

http://www.hypertransport.org/tech/index.cfm

32 bit的情況下,單向可達11.2GBps,雙向就是22.4 GBps
如果能提升到64 bit,雙向就可以達到44.8 GBps
或是提升時脈, 也可以提升頻寬

引用:

作者Arucueid

那個成本很高啦。
而且我記得現在是在講GPU.....

目前真的能當GPU's NUMA-Link的，應該只有FlexIO這種level的bus。

引用:

作者Arucueid

64bit版本是幾乎不太可能真的去用的
事實上32bit都不一定會真正實作出成品
Intel的AGTL+一樣有32bit到128bit的規範
但是32bit版本也只出現在昂貴的IA64上面

增加匯流排寬度，通常是最後不得已的方式
更寬的匯流排，代表成本的必然性的增加
匯流排的寬度增加的腳步，跟頻寬增加的幅度相比
就可以發現前者的進步腳步，居然是如此之慢了

還有一個可能:
繪圖

引用:

作者r580

還有一個可能:
繪圖

其實還是有不少用途有可能用到這麼大的記憶體，只是以前可能因為記憶體不夠，
所以沒辦法處理而已：

如斷層掃描的3D顯影，解析度如果拉高的話，資料量很容易提高一個數量級，
處理就會很慢.... 一直到有夠快的設備可以處理它、可以real-time為止。
比方說，一份512x512x512的32bit 3D texture，就會需要512MB以上的記憶體，
而這個其實是GF3開始就支援的格式與解析度。

我想起AMD有打算把PCI-E控制器內建，這樣可以出現足以支撐NUMA的BUS嗎？

引用:

作者熱鬥小狐

我想起AMD有打算把PCI-E控制器內建，這樣可以出現足以支撐NUMA的BUS嗎？

關係不大。
現在需要的是兩個GPU間的大頻寬bus....
比方說Cell 提供的FlexIO頻寬為最大75GB/s、
而在和RSX(G71拔掉PCIe換成FlexIO)連接的頻寬是上傳15GB/s、下傳20GB/s，
這都比目前的PCIe 16x大上許多。

----
話說回來，其實回頭一看NV30已經支援到1GB了，所以這樣一來NV40/G70支援到2GB其實看起來相當合理。
請參考ExtremeTech的"Inside the GeForceFX Architecture"一文。