PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   [Process Tamer] 虛擬HT工具-讓你的CPU也擁有HT -AMD User也可以用 (https://www.pcdvd.com.tw/showthread.php?t=510047)

RogerShih 2005-07-14 02:59 AM

引用:
作者ianme
我想那個不是ALU,此邏輯運算單元,不是指算數邏輯運算單元,可以想成是邏輯閘啦,CPU兩組ALU為何不可能?只要你想的到的,就一定有機會實現,這是邏輯設計的魅力所在...好玩耶。


你講到 Dual Core 去了....... 有兩組 ALU 就乾脆 Dual Core 不就好了?不就是現在 Intel 跟 AMD 在做的了?

ianme 2005-07-14 03:01 AM

引用:
作者RogerShih
你的觀念有部份是有點不太正確, 你認為 HT 是把 CPU 最高效率降下來, 但我認為 HT 卻是恢復 P4 原有效率的設計.

以 HT 的官方說明來看, HT 是把單一的 CPU 資源分給兩個 thread, 當某一個 thread 產生空檔、或是分時、或是分支預測錯誤(特別是這個會造成效能較差, P4 設計上不如 P-M 的主因), 就將資源交給另一個 thread 來用.

P4 因為他管線過長, 當分支預測錯誤時, 效能浪費比較明顯, 所有設計 HT, 讓 P4 不會因為這樣的錯誤, 讓 CPU 資源停在那裡沒人可用, 所以才多一個單元來塞另一個指令給 CPU 去跑.

站在多工作業系統的優先權設計來看, HT 這樣的設計法正好符合程式執行的空檔時轉移資源給其他的程式.

因為優先權的設計, 是碰到高優先權的程式時, 會把比較多的 CPU 資源 (執行時間) 分配給他, 但是當高優先權的程式不需要或空檔的時候, 作業系統就會把資源釋放出來給其他的程式去分配.
...


ㄜ..可能是我打在一起的讓人誤會,我說最高效率降下來的是指ProcessTramer拉。HT當然是為了提升原本架構的。

只是HT碰上未幫他最佳化的軟體時,還有可能會更慢.....之前朋友換上有HT的CPU之後,還直說為啥3DMark 03下降了咧 :jolin:

ianme 2005-07-14 03:04 AM

引用:
作者RogerShih
你講到 Dual Core 去了....... 有兩組 ALU 就乾脆 Dual Core 不就好了?不就是現在 Intel 跟 AMD 在做的了?


我只是想要告訴他世界上有無限種可能而已 :)

RogerShih 2005-07-14 03:05 AM

引用:
作者ianme
ㄜ..可能是我打在一起的讓人誤會,我說最高效率降下來的是指ProcessTramer拉。HT當然是為了提升原本架構的。


我只能說, 整體效能是不變的, 對作業系統來說, 總體的效能不變, 只是 ProcessTramer 把效能分配的方法做了調整.

P4 有分 HT 跟沒有 HT 的版本, 沒有 HT 的版本效能如何應該都了解, 而 HT 則是把整體效能拉回一定程度, 說他是虛擬雙 CPU , 我認為也是言過其實, 事實上 intel 也沒這樣說吧.

有人會因為即使是 HT 的 P4 跑 CPU mark 是笑話, 但是在 P4 的設計來看, CPU Mark 正好是單一 thread 的程式, 正好反映出 P4 原本設計上的問題, 只能靠拉高時脈來解決. 而 HT 的設計, 是讓 P4 在執行多工環境時, 讓整體效能比較好看, 減少多工效能因為設計上的問題而減損.

可以這麼說, HT 是因為 P4 而存在的, 其他像 PM 或 K8 不用 HT , 是因為這些 CPU 的設計並沒有 P4 的問題.

ianme 2005-07-14 03:16 AM

超 執 行 緒 (HT) 技 術 的 運 作 方 式



雖 然 加 快 時 脈 速 度 是 增 強 電 腦 運 算 動 力 的 重 要 方 式 之 一 , 而 Intel 向 來 在 刷 新 處 理 器 時 脈 速 度 方 面 獨 步 群 雄 , 但 光 靠 時 脈 速 度 是 不 夠 的 。 另 一 個 提 升 效 能 的 途 徑 , 是 在 每 個 時 脈 週 期 間 完 成 更 多 工 作 , 這 也 就 是 超 執 行 緒 (Hyper-Threading , HT) 技 術 的 關 鍵 。 一 顆 含 超 執 行 緒 (HT) 技 術 的 處 理 器 , 對 新 一 代 作 業 系 統 及 應 用 程 式 而 言 , 會 呈 現 為 兩 顆 虛 擬 處 理 器 。 它 可 以 同 時 處 理 兩 組 不 同 的 工 作 , 充 份 利 用 以 往 閒 置 的 資 源 , 讓 您 得 以 在 相 同 的 時 間 內 完 成 更 多 作 業 , 享 受 事 半 功 倍 的 優 勢 。 進 一 步 瞭 解 運 作 方 式 。

在 桌 上 型 電 腦 、 筆 記 型 電 腦 以 及 初 階 工 作 站 電 腦 中 , 超 執 行 緒 (HT) 技 術 可 以 發 揮 Windows* XP 及 各 種 先 進 應 用 程 式 內 建 的 多 執 行 緒 功 能 。 多 執 行 緒 軟 體 會 將 工 作 量 分 散 給 可 單 獨 排 程 及 分 派 的 流 程 和 執 行 緒 。 在 多 重 處 理 器 的 系 統 中 , 這 些 執 行 緒 會 在 不 同 的 處 理 器 上 執 行 。 而 超 執 行 緒 (HT) 技 術 則 是 將 單 一 Pentium 4 處 理 器 當 做 兩 個 「 虛 擬 」 或 「 邏 輯 」 處 理 器 來 使 用 。 雖 然 電 腦 中 只 有 一 顆 實 體 的 Pentium 4 處 理 器 , 但 卻 能 同 時 執 行 兩 個 執 行 緒 。

在 伺 服 器 以 及 高 效 能 工 作 站 電 腦 上 , 超 執 行 緒 (HT) 技 術 可 以 實 現 執 行 緒 層 級 的 平 行 處 理 (Thread-Level Parallelism , TLP) , 方 法 是 藉 由 複 製 每 一 個 處 理 器 的 結 構 狀 態 , 並 共 享 一 組 處 理 器 執 行 資 源 。 為 執 行 緒 進 行 排 程 時 , 作 業 系 統 會 將 這 兩 個 結 構 狀 態 視 為 個 別 的 「 邏 輯 」 處 理 器 , 並 提 供 給 具 多 重 處 理 器 功 能 的 軟 體 執 行 作 業 , 讓 這 些 軟 體 在 不 需 要 修 改 的 情 況 下 , 即 可 運 用 兩 個 邏 輯 處 理 器 。 雖 然 超 執 行 緒 (HT) 技 術 所 提 高 的 效 能 , 與 實 際 安 裝 兩 顆 處 理 器 不 能 相 提 並 論 , 但 是 效 能 標 竿 測 試 資 料 顯 示 某 些 應 用 程 式 的 效 能 可 以 增 加 高 達 30% 。 此 技 術 也 可 以 提 高 在 Microsoft Windows* 2000 Advanced Server 作 業 系 統 上 執 行 的 應 用 程 式 , 但 是 能 夠 真 正 將 超 執 行 緒 (HT) 技 術 的 威 力 發 揮 到 極 致 的 作 業 系 統 , 是 有 針 對 此 技 術 進 行 最 佳 化 的 作 業 系 統 , 包 括 : Microsoft .NET* Server 、 Windows XP* 、 以 及 某 些 Linux* 版 本 。

ianme 2005-07-14 03:17 AM

不好意思,不會貼圖,我會好好學的....太懶了> <

手上也有一些英文的一些文件,有興趣可以找我要。我沒有全部看完說,看了一兩篇就不想看了....懶惰 :stupefy:

RogerShih 2005-07-14 03:32 AM

引用:
作者ianme
超 執 行 緒 (HT) 技 術 的 運 作 方 式

雖 然 加 快 時 脈 速 度 是 增 強 電 腦 運 算 動 力 的 重 要 方 式 之 一 , 而 Intel 向 來 在 刷 新 處 理 器 時 脈 速 度 方 面 獨 步 群 雄 , 但 光 靠 時 脈 速 度 是 不 夠 的 。 另 一 個 提 升 效 能 的 途 徑 , 是 在 每 個 時 脈 週 期 間 完 成 更 多 工 作 , 這 也 就 是 超 執 行 緒 (Hyper-Threading , HT) 技 術 的 關 鍵 。 一 顆 含 超 執 行 緒 (HT) 技 術 的 處 理 器 , 對 新 一 代 作 業 系 統 及 應 用 程 式 而 言 , 會 呈 現 為 兩 顆 虛 擬 處 理 器 。 它 可 以 同 時 處 理 兩 組 不 同 的 工 作 , 充 份 利 用 以 往 閒 置 的 資 源 , 讓 您 得 以 在 相 同 的 時 間 內 完 成 更 多 作 業 , 享 受 事 半 功 倍 的 優 勢 。 進 一 步 瞭 解 運 作 方 式 。

在 桌 上 型 電 腦 、 筆 記 型 電 腦 以 及 初 階...


我覺得那說明有點取巧, 應該說是當產生效能浪費的時候, 可以不必要浪費多餘的週期, 也就等於多執行更多的指令.

第二個貼圖也點出了, 實體的 CPU 就是只有一個, 一個核心, 兩個 thread, 當其中一個 thread 出現任何資源切換、錯誤、空檔等, 就可以直接把 CPU 資源交給另一個預先讀取好指令序列的 thread 來用, 尤其是像分支預測錯誤, 因為 P4 的管線很深, 所以當分支預測錯誤時, 沒有 HT 的 P4 要讀入正確的指令序列花的時間要比較多, 當 P4 在讀取這些指令進 CPU 時, CPU 的運算資源是 idle 在那裡沒做事的, 而 HT 就是設計來弭補這樣的空檔.

ianme 2005-07-14 03:37 AM

這是官方的東西嘛,有興趣來個原文的嗎?看完要來分享一下心得歐。

RogerShih 2005-07-14 03:44 AM

引用:
作者ianme
這是官方的東西嘛,有興趣來個原文的嗎?看完要來分享一下心得歐。


我找找看有沒有 white paper 可看, 原來 Intel 官方宣傳也是當做虛擬雙 CPU 來看待.

在技術上, 我前面解釋的應該是沒錯, 只是 Intel 把它做這樣簡化, 未免有點.... :stupefy:

話說回來, 沒去碰底層的技術, 誰有興趣了解他的來龍去脈啊.

ianme 2005-07-14 03:52 AM

不用找了,您有mail嗎?我寄給您。我不知道這種文件可不可以曝光,所以還是用寄的吧。之前想要.18的TSMC model竟然說要申請啦....真是.....


所有的時間均為GMT +8。 現在的時間是09:49 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。