PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)
-   -   INQ:NV40/45與G70可以支援2GB記憶體 (https://www.pcdvd.com.tw/showthread.php?t=561045)

Artx1 2005-11-19 11:47 PM

引用:
作者ccyew
看不是很懂^^;

以目前SLI的情況應該就是完全映射的做法,不過之前看過一篇文章是指說新的SLi技術可以使兩張卡的記憶體變成256+256=512,而不是256copy256還是=256

那篇......找不到....OTL

總之,現在就看nV怎麼玩接下來的顯卡設計了^^;

PS. 8個顆粒就可以上1G的記憶體......很貴吧><


你在找這篇嗎?

Private addressing in a multi-processor graphics processing system

主要內容是說,SLI本身最初的規格就已經具有NUMA能力了。

-----
說實話,我覺得是實體連接1GB、SLI private 定址兩張是最有可能的;其次是Bank interleave接更多顆DRAM,或者是"定址能力有、留待未來更大容量記憶體顆粒",不過最後一項與"已有支援如此容量之產品出貨"不符。
以我的想法,這篇新聞如果不是"單顆"NV40/45 & G70可以上2GB,那就沒有意義了。
因為目前上述的幾個晶片並不存在足夠大的bus可以作為有效的NUMA之用:
SLI MIO-port只有1GB/s,太小。
靠雙PCIe 16x也只能確保2.1GB/s雙向,和卡上動輒30~40GB/s的頻寬相比,要作為NUMA過於勉強。
事實上,SLI會不啟動NUMA、而以目前會損耗記憶體容量的結構來運作,顯然就是因為不存在足以支撐NUMA的BUS所致的。

艾克萊爾 2005-11-20 12:07 AM

引用:
作者stratos2005
如果要用UMA的方法管理,gpu彼此溝通的速度必須非常快
我覺得有點難.....因為gpu對記憶體頻寬要求大於cpu很多
而cpu就算是amd採用的ht的crossbar也只有6.4gbps
這對處理器來說也許夠了,但是對gpu來說就相當的慢
例如K8 2 Way處理器採用UMA定址,記憶體頻寬馬上變成一半
就算用Node Interleaving,能補回20%的頻寬就相當不錯了

我不知道gpu上會不會有比較完美的方式可以做
cpu上面的uma或numa,不管哪種方式,都沒有記憶體的浪費
gpu採numa,我猜想他根本用完全映射
來達成最高的頻寬,gpu交換的資料也降到最低
但是也造成了大量的記憶體浪費


要不要把htt規格複習一下?
HyperTransport

HyperTransport

HyperTransport

stratos2005 2005-11-20 01:40 AM

引用:
作者艾克萊爾


嗯..複習了..但是..不懂為何要複習
您給的每個連結,都是寫這樣
Bandwidth(Each Direction) 100 to 6500 Mbytes/sec
6500mbps是32bit連結的版本,目前沒有任何實物
只是有規範,而htt當然有制訂更高的規格
目前Opteron有使用的就是16bit with的3.2gbps版本
所以雙向是6.4gbps,這就是一般在用的模式
5 bits的規格事實上某些Opteron上搭配主機板也可以做
那也就是將6.4gbps提高到8gbps

Arucueid 2005-11-20 09:59 AM

http://www.hypertransport.org/tech/index.cfm

32 bit的情況下,單向可達11.2GBps,雙向就是22.4 GBps
如果能提升到64 bit,雙向就可以達到44.8 GBps
或是提升時脈, 也可以提升頻寬

Artx1 2005-11-20 02:44 PM

引用:
作者Arucueid
http://www.hypertransport.org/tech/index.cfm

32 bit的情況下,單向可達11.2GBps,雙向就是22.4 GBps
如果能提升到64 bit,雙向就可以達到44.8 GBps
或是提升時脈, 也可以提升頻寬


那個成本很高啦。
而且我記得現在是在講GPU.....

目前真的能當GPU's NUMA-Link的,應該只有FlexIO這種level的bus。

stratos2005 2005-11-20 05:39 PM

引用:
作者Arucueid
http://www.hypertransport.org/tech/index.cfm

32 bit的情況下,單向可達11.2GBps,雙向就是22.4 GBps
如果能提升到64 bit,雙向就可以達到44.8 GBps
或是提升時脈, 也可以提升頻寬


64bit版本是幾乎不太可能真的去用的
事實上32bit都不一定會真正實作出成品
Intel的AGTL+一樣有32bit到128bit的規範
但是32bit版本也只出現在昂貴的IA64上面

增加匯流排寬度,通常是最後不得已的方式
更寬的匯流排,代表成本的必然性的增加
匯流排的寬度增加的腳步,跟頻寬增加的幅度相比
就可以發現前者的進步腳步,居然是如此之慢了

r580 2005-11-20 06:06 PM

還有一個可能:
繪圖

Artx1 2005-11-20 09:10 PM

引用:
作者r580
還有一個可能:
繪圖


其實還是有不少用途有可能用到這麼大的記憶體,只是以前可能因為記憶體不夠,
所以沒辦法處理而已:

如斷層掃描的3D顯影,解析度如果拉高的話,資料量很容易提高一個數量級,
處理就會很慢.... 一直到有夠快的設備可以處理它、可以real-time為止。
比方說,一份512x512x512的32bit 3D texture,就會需要512MB以上的記憶體,
而這個其實是GF3開始就支援的格式與解析度。

熱鬥小狐 2005-11-21 12:54 PM

我想起AMD有打算把PCI-E控制器內建,這樣可以出現足以支撐NUMA的BUS嗎?

Artx1 2005-11-26 02:39 AM

引用:
作者熱鬥小狐
我想起AMD有打算把PCI-E控制器內建,這樣可以出現足以支撐NUMA的BUS嗎?


關係不大。
現在需要的是兩個GPU間的大頻寬bus....
比方說Cell 提供的FlexIO頻寬為最大75GB/s、
而在和RSX(G71拔掉PCIe換成FlexIO)連接的頻寬是上傳15GB/s、下傳20GB/s,
這都比目前的PCIe 16x大上許多。

----
話說回來,其實回頭一看NV30已經支援到1GB了,所以這樣一來NV40/G70支援到2GB其實看起來相當合理。
請參考ExtremeTech的"Inside the GeForceFX Architecture"一文。


所有的時間均為GMT +8。 現在的時間是08:42 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。