首頁 -> 網絡技術 -> 技術前哨 -> 正文
整合顯存是未來 從Intel及NVIDIA說起

《中無通訊》第71期 文∶ 世界網絡 www.581895.tw 林和安 小洛夫

wpsCBAD.tmp

論現今廠商提升晶片性能的法門,以架構的更新獲利最大,這便離不開新增更多功能、提升時脈之類。然而,新增功能需要投入大量的研發及測試時間,提升時脈則大大增加功耗,同樣不是短時間內能上馬的靈單妙藥。于是廠商們另辟途徑,嘗試整合內存以加快處理數據速度,這在CPU上已是每代產品的指定動作,最近開始為GPU廠商所取用。

Intel最早整合eDRAM

對于GPU廠商來說,由于采用與CPU不同的架構; GPU架構重平行計算,可直接通過增加核心的數目來直線提升性能,這點與CPU重視執行效率不同。NVIDIA GeForce GTX TITAN X內建3072個CUDA Cores,相當于整合3072個小CPU核心,這在CPU上是不可思議的事情。同樣對于GPU來說,也沒必要采用CPU動輒8MB以上的快取記憶體,F時整合L2 Cache最大的NVIDIA Maxwell也不過是2MB,可見兩者設計上的不同。不過,在GPU與CPU設計最終會走在一起,在2013年,Intel成功把128MB eDRAM整合到Intel Iris Pro Graphics顯示核心去,自始宣布GPU整合顯存的開始。

為何選擇eDRAM

在介紹Intel Iris Pro Graphics前,筆者想先為大家介紹甚么是eDRAM。eDRAM全名Embedded DRAM,簡單來說是把現在DDR整合到SoC。有別于CPU/GPU一般采用的SRAM,DRAM的特點是結構簡單、容量大(理論上是SRAM的6倍),但缺點是需要定時刷新(Refreshing)數據,會增加功耗。對于Intel來說,在22nm制程下,每Cell bit的面積在SRAM為0.108um2,而在eDRAM不過是0.029um2,相當于提升3倍多的容量,足以抵消其缺點。雖然如此,但據Realworldtech分析,在22nm制程下,Intel為了128MB eDRAM需要額外60mm2的面積,相當于增加50美元的成本,十分可觀。(原文請見http://www.realworldtech.com/intel-dram/2/)

Intel Iris Pro Graphics這品

2013年Intel發布新一代Haswell架構CPU,同時推出高檔整合顯示核心,即Iris Graphics(GT3)及Iris Pro Graphics(GT3e),其中Iris Pro Graphics便是整合128MB eDRAM的版本,也是本文的主角。然而,Intel的整合并不是一個嚴謹的做法,事實上在Iris Pro Graphics的CPU版本上可以見到兩個獨立的核心,其中大的一顆是CPU + GPU,而小的一顆是128MB eDRAM。這兩顆核心不但并未封裝在一起,而且制程及工作頻率也南轅北轍。CPU/GPU的那顆采用高性能的22nm制程,工作頻率可在3GHz以上。而128MB eDRAM則采用低功耗的22nm制程,工作頻率只有1.6GHz。

在性能方面,Intel表示整合128MB eDRAM的版本可提供主流NVIDIA GT650M獨立顯示卡的效能,當然這只是理想。先看看紙面性能方面,Intel 128MB eDRAM一條很窄的串行總線,雙向頻寬僅有50GB/s,連同128-bit DDR3-1600存儲器25.6GB/s也不過是75.6GB/s頻寬,略輸于GT 650M 128-bit 5GHz GDDR5的頻寬80.3GB/s。另外,筆者在網上找到的測試成績是,在3D Mark Fire Strike測試,整合Iris Pro 5200的Core i7-4750HQ得分可達1302,比整合Iris 5100的Core i5-4278U的889分有46%的可觀效能增長,但無法與A10-7850K整合Raden R7顯示的1439相比。AMD APU尚且不敵,更遑論NVIDIA GT650M,只可說這是Intel整合GPU先天不足的問題,eDRAM有其價值所在。(原文請見http://www.pcpop.com/doc/1/1058/1058256_all.shtml)

在此簡單Intel整合eDRAM的作用,是有增加頻寬,降低系統延遲從而提升性能的效果。除此以外,eDRAM也可降低對DDR3的讀寫需求,有助降低系統功耗。另外,Intel架構圖也表明了eDRAM還可作CPU的L4 Cache使用,這解釋了為何Intel不惜工本也要加入128MB eDRAM的原因。

wpsCBBE.tmp

Intel整合128MB eDRAM其實是獨立的一顆芯片,未算真正整合。

wpsCBCE.tmp

就這幅架構圖所見,Iris Pro Graphics除了使用eDRAM提供的頻寬外,同一時間也使用了傳統DDR3記憶體頻寬。

NVIDIA Volta GPU

并不是每家廠商都像Intel擁有尖端的半導體工廠,對于NVIDIA及AMD來說,它們要內建顯存,便得采用MCM多晶片封裝技術,即在同一基板上內建特制的DRAM,稱為Stacked DRAM。

最早提出Stacked DRAM產品的是NVIDIA。在GTC 2013中,NVDIA發表最新產品Roadmap,表示在2016年左右推出新一代Volta GPU,計劃在GPU的四周整合Stacked DRAM,預計可提供1TB/s記憶體頻寬,差不多是當時NVIDIA旗艦產品288GB/s記憶體頻寬的4倍,即時引起市場上熱烈的討論。及在2014年,NVIDIA更新產品Roadmap,原來的Volta GPU不見了,改在2016-2017年左右推出整合3D Memory的Pascal GPU,但這代表NVIDIA計劃有變或整合Stacked DRAM產品會推遲嗎?不是的,雖然下一代GPU計劃推遲了,但會于這一代Maxwell GPU中追加Stacked DRAM的支援。這當中有被迫的成份,因為AMD整合顯存的產品馬上要推出了。

wpsCBDF.tmp

NVIDIA在GDC2013發表的產品Roadmap表示,新一代Volta GPU將整Stacked DRAM。

wpsCBE0.tmp

Volta計劃整合6顆Stacked DRAM。

wpsCBF1.tmp

在2014年Volta改為Pascal,而Stacked DRAM也改為3D Memory。

wpsCBF2.tmp

3D Memory堆棧多層存儲器,計劃在2016年提供1TB/s以上的存儲器頻寬。

AMD整合顯存的產品

與NVIDIA的事先張揚的做法不同,AMD選擇相對沉默,直到R9 300系列產品差不多推出才公布會在新一代GPU的四周整合HBM記憶體。HBM全名High Bandwidth Memory,從它的名字得知是一種高頻寬的記憶體。它的原理是把4顆記憶體(第一代)以TSV穿孔的方式堆疊起來,可用頻寬是現有頂級7Gbps GDDR5的3.5倍以上(100GB/s vs 28GB/s),而且體積細小,如同樣是1GB GDDR5要672mm2,HBM只要35mm2,相當于前者的5%左右,可輕易在GPU四周內建4顆HBM記憶體,至少提供400GB/s頻寬,大大領先R9 290X的320GB/s頻寬,實現不同世代的性能。

另外,也許大家會問,NVIDIA及AMD整合顯存的做法,顯示卡廠商們會愿意接受嗎?其實,現時NVIDIA及AMD的GDDR5 GPU普遍采用GPU + GDDR5捆綁式銷售的做法,令顯示卡廠商難以改動卡上的顯存,F在GPU廠商只是變本加厲,令改動顯存變得完全不可能然而。

wpsCC02.tmp

AMD新一代GPU會把HBM封裝在同一PCB基板上。

wpsCC13.tmp

與現時最快的GDDR5相比,HBM的速度是前者的3.5倍以上。

結論∶整合顯存勢不可擋

總結本文,目前有Intel整合eDRAM及NVIDIA/AMD整合Stacked DRAM兩種不同的做法。前者技術門檻極高,因為需要先進的半導體制支持,后者只要采購昂貴的新一代HBM記憶體即可解決,以技術而論Intel是略為先進,但其GPU技術的落后所以也沒有可比性,而且最終都沒有整合了CPU晶片去,算不上真正的整合。從眾多廠商整合DRAM的做法只說明了一點∶整合是新潮流,大家準備好沒有呢。

文章搜索

覆蓋全國各省會城市及海外城市的網速測試
→選擇要測試的地區
→選擇目標測試點
>> 測試點注冊
时时彩计划