GDDR是Graphics Double Data Rate的縮寫,全稱為雙圖像倍數(shù)據(jù)速率。它是一種專為圖形處理單元(GPU)設計的同步雙數(shù)據(jù)速率動態(tài)隨機存取存儲器(SDRAM)。1998年,三星電子推出了首款16 Mb GDDR內存芯片。自此拉開了GPU和CPU在內存道路上的分道揚鑣。起初,顯卡內存兼容CPU內存,主要使用DDR內存,然而鑒于圖像處理需求逐年攀升,顯卡逐漸轉向采用專門為圖形處理器(GPU)設計GDDR。由于GDDR具有更高的數(shù)據(jù)傳輸速率和帶寬,在推動GPU的發(fā)展過程中起到了很關鍵的作用。
GDDR技術發(fā)展歷程
歷經二十余年發(fā)展,GDDR家族已經迭代至第七代,GDDR家族主要有GDDR、GDDR2、GDDR3、GDDR4、GDDR5 和 GDDR6,以及最新推出的GDDR 7。在此,我們先看下前六代的技術和性能上的情況。
來源:imec
雖然GDDR專為GPU設計,但是最開始的一二代GDDR和GDDR 2并沒有比DDR提升很多,因此也沒得到GPU廠商的大規(guī)模采用。所以GDDR的正式被認可和迭代可以說是從GDDR3開始。
自GDDR3開始,Nvidia和AMD等主要GPU廠商的參與使得GDDR標準得到了大幅提升,得益于制程工藝的不斷進步,GDDR3內存的數(shù)據(jù)傳輸速率從最初的1GHz一路攀升至2.5GHz,實現(xiàn)了大幅提升,并保持了長達五年的生命周期,為現(xiàn)代圖形處理和計算提供了強大的支持。
GDDR4在GDDR3的基礎上,進一步提升了數(shù)據(jù)傳輸速率和能效。雖然GDDR4在技術上取得了進步,但由于當時NVIDIA和ATI之間對于GDDR 4標準意見相左,且存在激烈的競爭關系,NVIDIA沒有采用GDDR 4,這導致其市場占有率相對有限,成本很高,GDDR4很快就被歷史所遺忘。
GDDR5大幅提升了帶寬和速度,成為2008年后高性能顯卡的標配。GDDR5具有更高的時鐘頻率和數(shù)據(jù)傳輸速率,廣泛應用于各類圖形處理和計算任務中。GDDR5之后,NVIDIA還與美光推出了GDDR5X半代產品,用于NVIDIA高端顯卡。
而GDDR6則在數(shù)據(jù)傳輸速率和能效方面進一步提升,成為現(xiàn)代高端GPU的主流選擇。GDDR6X引入了PAM4(Pulse Amplitude Modulation 4)信號技術,顯著提高了數(shù)據(jù)傳輸速率。Nvidia在其Ampere架構,如GeForce RTX 3080和RTX 3090,率先采用了GDDR6X內存。
可以看出,從最初的GDDR到最新的GDDR6,GDDR內存經歷了多次技術迭代和性能提升。每一代GDDR內存都在數(shù)據(jù)傳輸速率、帶寬和能效方面不斷優(yōu)化,滿足了GPU和圖形處理日益增長的需求。如今,它已成為人工智能和大數(shù)據(jù)應用領域中最受歡迎的內存芯片之一。
GDDR7大戰(zhàn)打響
目前,三星、美光和SK海力士均已開始提供GDDR7內存樣品,GDDR 7大戰(zhàn)即將拉開序幕。
三星和SK海力士打頭陣
三星和SK海力士在今年3月份NVIDIA的GTC大會上均宣布了各家GDDR7的相關指標。兩家公司都展示了16Gb(2GB)密度的產品,24Gb(3GB)更高版本沒有在這一波浪潮中展現(xiàn)。
按照三星的披露,三星GDDR7芯片能夠在僅1.1 V的DRAM電壓下實現(xiàn)32 Gbps的速度,這超過了JEDEC的GDDR7規(guī)范中的1.2 V,這一性能是通過首次應用PAM3信號實現(xiàn)的。再加上三星特有的其他電源管理創(chuàng)新,能源效率提高了20%,將待機功耗降低 50%,從而減少整體功耗。三星還在封裝基板方面進行了一些創(chuàng)新,它使用了一種導熱性高、熱阻低的環(huán)氧模塑料 (EMC) 進行 GDDR7 封裝,以確保有源元件(IC本身)不會過熱,與 GDDR6 芯片相比,熱阻降低了70%。這些芯片采用512M x32組合,采用266針FBGA 封裝。
而SK海力士表示它將提供速度高達40 Gbps的GDDR7芯片。與其前身GDDR6相比,最新的GDDR7產品提供的最大帶寬達到160GB/s,是其上一代產品(GDDR6位80GB/s)的兩倍,功耗效率提升了40%,同時,內存密度提升了1.5倍,使得視覺效果也進一步得到增強。獨立的四通道的模式,提高了內存并行處理能力,每個通道支持32字節(jié)的數(shù)據(jù)訪問。除了四通道模式,GDDR7還支持雙通道模式,提供了靈活的配置選項,以適應不同的應用需求和系統(tǒng)架構。
SK海力士GDDR7技術指標
(來源:SK海力士)
SK海力士GDDR7采用與GDDR6相同的板尺寸,大小為12mm x 14mm,這意味著在設計和制造過程中,GDDR7可以直接替換現(xiàn)有的GDDR6模塊,而無需對電路板進行重新設計。此外,GDDR7內存還配備了專用的內存實現(xiàn)方案和PCB(印刷電路板)設計,以最大化其性能和效率。
(來源:SK海力士)
SK海力士的16Gb GDDR7 芯片基本已經準備就緒,將在今年晚些時候批量出貨。三星的也在出樣品的過程中。
雖然尚不清楚誰將成為三星和SK海力士GDDR7內存的首批客戶,但是考慮到兩家均在NVIDIA GTC2024上進行展示,這也很清楚地表明NVIDIA是其中之一。
姍姍來遲的美光
2024年6月4日,美光宣布開始為下一代GPU提供GDDR7內存樣品,它有28GB/s和32Gb/s兩種速度。新一代GDDR7采用美光科技的1β (1-beta) DRAM 技術制造,在能效和性能上實現(xiàn)了大幅提升。
美光在宣布這一消息時公布了一些誘人的數(shù)字。該公司表示,32Gb/s GDDR7提供的內存帶寬比GDDR6高出60%,在384位總線上可達到1.5TB/s的內存帶寬。這比其前代產品有了顯著的飛躍,前代產品在RTX 4090等 GPU上的384位內存總線上最高可達1TB/s。同時,工作電壓降低至1.2V,上一代為1.35V,美光表示,其GDDR7的效率比GDDR6 提高了50%,實現(xiàn)節(jié)能的方式主要包括分割電壓平面、部分設備運行和休眠模式。采用FBGA更薄的封裝高度(1.1mm對比1.2mm)和高熱導EMC封裝,提供65%更好的熱阻,這為臺式機和筆記本電腦提供了更好的熱管理。
美光GDDR6與GDDR7特點比較
美光GDDR7的這些特性提升使其在游戲、生成式AI、高性能計算(HPC)領域前景廣闊。也就意味著GDDR7可能與HBM相競爭。如美光所述,在游戲領域,GDDR7預計在每秒幀數(shù)(FPS)方面可提升超過30%,特別是在光線追蹤和光柵化工作負載下;在生成式AI應用中,GDDR7提供超過1.5 TB/s的高系統(tǒng)帶寬,預計可將生成式AI文本到圖像生成的響應時間減少多達20%;對于HPC,GDDR7預計能夠減少處理時間,實現(xiàn)復雜工作負載(如動畫、3D設計、科學仿真和金融建模)的無縫多任務處理。
據(jù)美光的公告,其GDDR7內存將于2024年下半年直接從美光以及通過精選的全球渠道分銷商和經銷商發(fā)售。NVIDIA使用美光的內存是板上釘釘了,因為此前美光專門為 Nvidia 制造了GDDR6x,不過在美光GDDR7的公告中也提到了AMD,因此AMD也可能會加入這一行列。
GDDR 7最大的技術變化
2024年3月,JEDEC發(fā)布了GDDR7 內存標準規(guī)范。JEDEC 是微電子行業(yè)標準制定領域的全球領導者。如下圖所示,GDDR7的每引腳帶寬最高可達48 Gbps,遠高于GDDR6和GDDR6X的24 Gbps。在256位總線寬度下,GDDR7的總帶寬達到1024 GB/sec,顯著高于GDDR6和GDDR6X的768 GB/sec。GDDR7的工作電壓為1.2 V,比GDDR6和GDDR6X的1.35 V更低。在信號技術上, GDDR7采用PAM-3信號技術,而GDDR6X采用PAM-4,GDDR6則使用傳統(tǒng)的NRZ信號技術。GDDR7的最大密度達到64 Gb,是GDDR6和GDDR6X的兩倍。GDDR7采用266 FBGA封裝,高于GDDR6和GDDR6X的180 FBGA。
圖表展示了GDDR7相對于前幾代在帶寬、功耗和封裝上的顯著改進。來源:anandtech
GDDR7最大的技術變化在于內存總線從2位不歸零 (NRZ) 編碼轉換為3位脈沖(-1、0、+1)幅度調制 (PAM3) 編碼。PAM3使GDDR7能夠在兩個周期內傳輸3位數(shù)據(jù),僅這一變化就讓數(shù)據(jù)傳輸效率提高了50%。隨著向PAM3信號的轉變,內存行業(yè)有了一條新途徑來擴展 GDDR 設備的性能并推動圖形和各種高性能應用的持續(xù)發(fā)展。
來源:三星
上圖可以很直觀的看出NRZ和PAM編碼的不同。
之前的GDDR標準使用非歸零(NRZ)技術,通過兩種信號電平來傳輸編碼為1或0的數(shù)據(jù)。這種方法在多個GDDR世代中都足夠使用,但隨著時鐘速度和系統(tǒng)復雜性的增加,成為了一大瓶頸。為了解決這一挑戰(zhàn),美光與英偉達推出了采用多級信號技術的創(chuàng)新GDDR6X技術。美光是唯一提供GDDR6X的公司,GDDR6X利用PAM4信號技術,提供了業(yè)界領先的>1.1 TB/s帶寬。
美光在GDDR6X方面的成功和經驗為下一代使用類似信號方法的GDDR奠定了基礎。雖然PAM3每周期傳輸?shù)谋忍財?shù)量低于GDDR6X上的PAM4,但PAM3提供了50%的更高電壓裕度,并且編碼復雜度更低,這減少了對內存總線更高頻率的需求,緩解了由此產生的信號損失。
值得一提的是,GDDR7將能夠在PAM-3和NRZ之間切換,具體取決于所承受的負載。當需要極高的性能時,會激活 PAM-3,但對于降低能耗很重要的情況(例如非游戲、桌面使用),則會啟用 NRZ 以保持良好的散熱效果。
另外一個很大的技術變革是,GDDR 7內存具有4個獨立通道,可優(yōu)化各種工作負載的數(shù)據(jù)流,因此延遲相對較低。
GDDR 通道架構
(來源:anandtech)
寫在最后
三星、SK海力士、美光三大存儲巨頭均推出了自家的GDDR7內存產品,并展開了激烈的競爭。誰能在這場技術競賽中脫穎而出,尚需時間驗證。然而,這場較量不僅僅關乎市場份額的爭奪,更在于誰能在性能、能效和創(chuàng)新應用上實現(xiàn)突破,引領下一代圖形內存技術的發(fā)展方向。
至于GDDR7的顯卡何時問世?考慮到 AMD 和 Nvidia 每兩年發(fā)布新 GPU 架構的節(jié)奏,NVIDIA 和 AMD 預計將在 2024 年下半年推出首款采用 GDDR7 的獨立 GPU。最可能的是消費級Blackwell架構產品和AMD的RDNA 4。讓我們拭目以待。