英特爾、三星和臺積電這三家領(lǐng)先的芯片代工廠已開始做出關(guān)鍵舉措,為未來幾代芯片技術(shù)吸引更多訂單,并為大幅提高性能和縮短定制設(shè)計的交付時間創(chuàng)造了條件。
與過去由單一行業(yè)路線圖決定如何進入下一個工藝節(jié)點不同,這三家世界最大的晶圓代工廠正越來越多地開辟自己的道路。但他們都朝著同一個大方向前進,即采用3D晶體管和封裝、一系列使能和擴展性技術(shù),以及規(guī)模更大、更多樣化的生態(tài)系統(tǒng)。但是,他們在方法論、架構(gòu)和第三方支持方面出現(xiàn)了一些關(guān)鍵性的差異。
三者的路線圖都顯示,晶體管的擴展將至少持續(xù)到18/16/14埃米(1埃米等于0.1nm)的范圍,并可能從納米片和forksheet FET開始,在未來的某個時間點出現(xiàn)互補FET(CFET)。主要驅(qū)動因素是人工智能(AI)/移動計算以及需要處理的數(shù)據(jù)量激增,在大多數(shù)情況下,這些設(shè)計將涉及處理元件陣列,通常具有高度冗余和同質(zhì)性,以實現(xiàn)更高的產(chǎn)量。
在其他情況下,這些設(shè)計可能包含數(shù)十個或數(shù)百個Chiplet(小芯片或芯粒),其中一些Chiplet專為特定數(shù)據(jù)類型而設(shè)計,而其他芯片則用于更一般的處理。這些芯片以2.5D配置安裝在基板上,這種方法因簡化高帶寬存儲器(HBM)的集成而在數(shù)據(jù)中心和移動設(shè)備中獲得了廣泛的應(yīng)用。移動設(shè)備還包括其他功能,如圖像傳感器、電源和用于非關(guān)鍵功能的附加數(shù)字邏輯。這三家代工廠也都在開發(fā)全3D-IC產(chǎn)品。此外,還將提供混合選項,即邏輯堆疊在邏輯上并安裝在基板上,但與其他功能分開,以盡量減少熱量等物理影響,這種異構(gòu)配置被稱為3.5D和5.5D。
快速和大規(guī)模定制
與過去相比,最大的變化之一就是能更快地將特定領(lǐng)域的設(shè)計推向市場。雖然這聽起來很普通,但對于許多尖端芯片來說,這是激烈競爭所必需的,它要求從根本上改變芯片的設(shè)計、制造和封裝方式。要使這一方案奏效,需要標準、創(chuàng)新連接方案和工程學(xué)科的組合。而在過去,這些學(xué)科之間即使有互動,也很有限。
這有時也被稱為“大規(guī)模定制”,包括通常的功率、性能和面積/成本(PPA/C)權(quán)衡,以及快速組裝選項。這就是異構(gòu)Chiplet的前景,從擴展的角度來看,它標志著摩爾定律的下一階段(即集成電路上可容納的晶體管數(shù)目翻倍)。十多年來,整個半導(dǎo)體生態(tài)系統(tǒng)一直在為這一轉(zhuǎn)變逐步奠定基礎(chǔ)。
但是,如何讓異構(gòu)Chiplet(基本上是來自多個供應(yīng)商和代工廠的加固IP)協(xié)同工作,既是一項必要的工程挑戰(zhàn),也是一項艱巨的工程挑戰(zhàn)。第一步是以一致的方式將Chiplet連接在一起,以實現(xiàn)可預(yù)測的結(jié)果,而這正是代工廠花費大量精力的地方,尤其是在通用Chiplet互連(UCIe)和Bunch of Wires(BoW)標準方面。雖然這種連接性是三者的關(guān)鍵要求,但也是分歧的主要領(lǐng)域之一。
在全面集成3D-IC之前,英特爾代工廠目前的解決方案是開發(fā)業(yè)內(nèi)人士所稱的針對Chiplet的“插槽”。英特爾代工廠不是為商業(yè)市場確定每個Chiplet的特性,而是定義規(guī)格和接口,這樣Chiplet供應(yīng)商就可以開發(fā)這些功能有限的微型芯片,以滿足這些規(guī)格要求。這解決了商業(yè)Chiplet市場的一大絆腳石。從數(shù)據(jù)速度到熱管理和噪聲管理,所有部件都需要協(xié)同工作。
英特爾的方案在很大程度上依賴于2014年首次推出的嵌入式多芯片互連橋(EMIB)。英特爾技術(shù)開發(fā)副總裁Lalitha Immaneni說:“EMIB底座真正酷的地方在于,你可以添加任意數(shù)量的Chiplet。我們在設(shè)計中使用的IP數(shù)量沒有限制,也不會增加中間件的尺寸,因此它的成本效益很高,而且與工藝無關(guān)。我們提供了一個封裝裝配設(shè)計工具包,它就像傳統(tǒng)的裝配PDK(工藝設(shè)計套件)。我們提供設(shè)計規(guī)則、參考流程,并告知允許的結(jié)構(gòu)。EMIB還會提供我們在裝配時所需的任何輔助材料!
根據(jù)設(shè)計的不同,封裝中可能會有多個EMIB,并輔以熱界面材料(TIM),以疏導(dǎo)可能滯留在封裝內(nèi)的熱量。隨著封裝內(nèi)計算量的增加,以及基板變薄以縮短信號傳輸距離,熱接口材料變得越來越常見。
但是,基板越薄,散熱效果就越差,這可能導(dǎo)致熱梯度隨工作負荷而變化,因此難以預(yù)測。要消除這些熱量,可能需要TIM、額外的散熱器,甚至可能需要微流體等更奇特的冷卻方法。
臺積電和三星也提供橋接器。三星在RDL(再分布層,是添加到集成電路或微芯片中以重新分配電氣連接的金屬層)內(nèi)部嵌入了橋接器,并將其稱為2.3D或I-Cube ETM。部分集成工作將預(yù)先在已知的良好模塊中完成,而不是依賴插槽方法。
Arm CEO Rene Haas在最近一次三星代工廠活動的主題演講中說:“將兩個、四個或八個CPU集成到一個系統(tǒng)中,這是非常成熟的客戶知道如何去做的事情。但是,如果你想構(gòu)建一個擁有128個CPU的SoC,并將其連接到神經(jīng)網(wǎng)絡(luò)、內(nèi)存結(jié)構(gòu)、與NPU接口的中斷控制器、連接到另一個Chiplet的片外總線,這將是一項艱巨的工作。在過去的一年半時間里,我們看到很多人都在構(gòu)建這些復(fù)雜的SoC,希望從我們這里得到更多。”
三星還一直在針對特定市場,建立Chiplet供應(yīng)商聯(lián)盟。最初的概念是由一家公司制造I/O芯片,另一家公司制造互連芯片,第三家公司制造邏輯芯片,當這種做法被證明可行時,再加入其他公司,為客戶提供更多選擇。
臺積電已經(jīng)嘗試了許多不同的方案,包括RDL和非RDL橋接、扇出、2.5D CoWoS(Chip On Wafer On Substrate)和系統(tǒng)集成芯片(SoIC),這是一種3D-IC概念,使用非常短的互連線將Chiplet封裝并堆疊在基板內(nèi)。事實上,臺積電幾乎為每種應(yīng)用都提供了工藝設(shè)計套件,并一直積極為高級封裝開發(fā)組裝設(shè)計套件,包括與之配套的參考設(shè)計。
面臨的挑戰(zhàn)是,愿意投資這些復(fù)雜封裝的代工廠客戶越來越需要非常定制化的解決方案。為了解決這一問題,臺積電推出了“3Dblox”新語言,這是一種自上而下的設(shè)計方案,融合物理和連接構(gòu)造,允許在兩者之間應(yīng)用斷言。這種沙盒方法允許客戶利用任何一種封裝方法,例如InFO、CoWoS和SoIC。這對臺積電的商業(yè)模式也至關(guān)重要,因為該公司是三家代工廠中唯一一家純粹的晶圓代工廠——盡管英特爾和三星在最近幾個月都獨立了他們的代工業(yè)務(wù)。
臺積電先進技術(shù)和掩模工程副總裁Jim Chang在2023年3Dblox首次推出時的一次演講中說:“我們的出發(fā)點是模塊化概念。我們可以用這種語言語法加上斷言來構(gòu)建完整的3D-IC堆疊。”
Jim Chang說,這是因為物理和連接設(shè)計工具之間缺乏一致性。但他補充說,一旦開發(fā)出這種方法,就能在不同的設(shè)計中重復(fù)使用Chiplet,因為大部分特性已經(jīng)明確定義,而且設(shè)計是模塊化的。
▲臺積電3Dblox方法
三星隨后于2023年12月推出了自己的系統(tǒng)描述語言3DCODE。三星和臺積電都聲稱自己的語言是標準,但他們更像是新的代工規(guī)則,因為這些語言不太可能在自己的生態(tài)系統(tǒng)之外使用。英特爾的2.5D方法不需要新的語言,因為其規(guī)則是由插槽規(guī)格決定的,這就為Chiplet開發(fā)人員縮短了上市時間,并提供了一種更簡單的方法,從而權(quán)衡了一些定制化。
Chiplet的挑戰(zhàn)
Chiplet的優(yōu)勢顯而易見,他們可以在任何合理的工藝節(jié)點上獨立設(shè)計,這對模擬功能尤為重要。但是,如何將這些元件組合在一起并獲得可預(yù)測的結(jié)果,一直是一項重大挑戰(zhàn)。事實證明,美國國防高級研究計劃局(DARPA)最初提出的類似樂高積木的架構(gòu)方案比最初設(shè)想的要復(fù)雜得多,需要廣泛的生態(tài)系統(tǒng)不斷做出巨大的努力才能使其發(fā)揮作用。
Chiplet需要精確同步,以便及時處理、存儲和檢索關(guān)鍵數(shù)據(jù)。否則,就會出現(xiàn)時序問題,即一項計算延遲或與其他計算不同步,從而導(dǎo)致延遲和潛在的死鎖。在任務(wù)或安全關(guān)鍵型應(yīng)用中,一秒鐘的損失都可能造成嚴重后果。
簡化設(shè)計流程是一項極其復(fù)雜的工作,尤其是在特定領(lǐng)域的設(shè)計中,不能一刀切。所有三家代工廠的目標都是為開發(fā)高性能、低功耗芯片的公司提供更多選擇。據(jù)估計,目前30%~35%的尖端設(shè)計啟動都掌握在谷歌、Meta、微軟和特斯拉等大型系統(tǒng)公司手中,尖端芯片和封裝設(shè)計的經(jīng)濟性已發(fā)生重大變化,PPA/C計算公式和權(quán)衡也是如此。
為這些系統(tǒng)公司開發(fā)的芯片可能不會進行商業(yè)銷售。因此,如果他們能實現(xiàn)更高的每瓦特性能,那么設(shè)計和制造成本就能被更低的冷卻功率和更高的利用率所抵消,從而可能減少服務(wù)器數(shù)量。反之,在移動設(shè)備和商品服務(wù)器中銷售的芯片則相反,高昂的開發(fā)成本可以通過巨大的銷量來攤銷。采用先進封裝的定制設(shè)計的經(jīng)濟性對兩者都有效,但原因卻截然不同。
縮小尺寸、提升性能和擴展
我們假定,在這些復(fù)雜的Chiplet系統(tǒng)中,會有多種類型的處理器,有些高度專業(yè)化,有些則更通用。由于功耗限制,其中僅有一部分處理器可能會在最先進的工藝節(jié)點上開發(fā)。先進的節(jié)點仍然可以提供更高的能效,從而在相同的面積上容納更多的晶體管,以提高性能。這對于人工智能/機器學(xué)習(xí)(ML)應(yīng)用至關(guān)重要,因為要更快地處理更多數(shù)據(jù),就需要在高度并行配置中進行更多的乘法/累加運算。更小的晶體管能提供更高的能效,使每平方毫米硅片能處理更多的數(shù)據(jù),但需要改變柵極結(jié)構(gòu)以防止漏電,這就是Forksheet FET和CFET即將問世的原因。
簡而言之,工藝領(lǐng)先仍然具有價值。率先將領(lǐng)先工藝推向市場有利于業(yè)務(wù)發(fā)展,但這只是更大難題中的一部分。所有三家代工廠都已宣布向埃米級范圍推進的計劃。英特爾計劃今年推出Intel 18A(1.8nm),幾年后再推出Intel 14A(1.4nm)。
▲英特爾路線圖
臺積電則將在2027年推出A16(1.6nm)。
▲臺積電埃米時代的擴展路線圖
三星將在2027年的某個時候通過SF1.4實現(xiàn)14埃米(1.4nm),顯然將跳過18埃米(1.8nm)、16埃米(1.6nm)。
▲三星的工藝擴展路線圖
從工藝節(jié)點的角度來看,所有三家代工廠都處于同一軌道上。但進步不再僅僅與工藝節(jié)點相關(guān)。人們越來越關(guān)注特定領(lǐng)域的延遲和每瓦性能,而這正是在真正的3D-IC配置中堆疊邏輯的優(yōu)勢所在,即使用混合鍵合將Chiplet連接到基板和彼此之間。在平面芯片上通過導(dǎo)線移動電子仍然是最快的(假設(shè)信號不需要從芯片的一端傳輸?shù)搅硪欢耍,但在其他晶體管上堆疊晶體管是次佳選擇,在某些情況下甚至比平面SoC更好,因為某些垂直信號路徑可能更短。
在最近的一次演講中,三星晶圓代工業(yè)務(wù)開發(fā)副總裁兼負責(zé)人Taejoong Song展示了一個路線圖,其特點是將邏輯疊加安裝在基板上,將2nm(SF2)晶粒與4nm(SF4X)晶粒組合在一起,兩者都安裝在另一個基板上。這基本上是2.5D封裝上的3D-IC,也就是前面提到的3.5D或5.5D概念。Taejoong Song表示,晶圓代工廠將從2027年開始在SF2P上堆疊SF1.4。這種方法特別吸引人的地方在于散熱的可能性。由于邏輯與其他功能分離,熱量可以通過基板或五個暴露面中的任何一面從堆疊的芯片中導(dǎo)出。
▲三星的AI 3D-IC架構(gòu)
與此同時,英特爾將利用其Foveros Direct 3D技術(shù)在邏輯上堆疊邏輯,可以是面對面堆疊,也可以是背對背堆疊。根據(jù)英特爾的一份新白皮書,這種方法允許來自不同代工廠的芯片或晶圓,連接帶寬由銅孔間距決定。白皮書指出,第一版將使用9微米的銅孔間距,而第二代將使用3微米的間距。
▲英特爾fooveros Direct 3D
英特爾的Lalitha Immaneni說:“真正的3D-IC將采用Foveros和混合鍵合技術(shù)。你不能再走傳統(tǒng)的設(shè)計路線,把它放在一起并進行驗證,然后發(fā)現(xiàn)‘哎呀,有問題’。不能再這樣做了,因為這會影響產(chǎn)品的上市時間。因此,你真的需要提供一個沙盒,使其具有可預(yù)測性。但即使在進入詳細設(shè)計環(huán)境之前,我也要進行機械/電氣/熱分析。我想看看連接情況,以免出現(xiàn)開路和短路。3D-IC的負擔更多在于代碼設(shè)計,而不是執(zhí)行!
Foveros允許將有源邏輯芯片堆疊在另一個有源或無源芯片上,基礎(chǔ)芯片用于連接36微米間距封裝中的所有芯片。通過利用先進的排序技術(shù),英特爾聲稱可以保證99%的已知良品率,以及97%的組裝后測試良品率。
臺積電的CoWoS則已被英偉達和AMD用于人工智能芯片的高級封裝。CoWoS本質(zhì)上是一種2.5D方法,通過硅通孔使用內(nèi)插器連接SoC和HBM存儲器。該公司的SoIC計劃更為雄心勃勃,將邏輯存儲器和傳感器等其他元件一起封裝在生產(chǎn)線前端的3D-IC中。這可以大大縮短多層、多尺寸和多功能的組裝時間。臺積電聲稱,與其他3D-IC方法相比,其鍵合方案能實現(xiàn)更快、更短的連接。一份報告稱,蘋果公司將從明年開始使用臺積電的SoIC技術(shù),而AMD也將擴大這種方法的使用范圍。
其他創(chuàng)新
工藝和封裝技術(shù)的到位為更廣泛的競爭選擇打開了大門。與過去由大型芯片制造商、設(shè)備供應(yīng)商和EDA公司確定芯片路線圖的情況不同,Chiplet世界為終端客戶提供了做出這些決定的工具。這在很大程度上要歸功于封裝所能容納的功能數(shù)量與SoC的網(wǎng)孔限制所能容納的功能數(shù)量之比。封裝可以根據(jù)需要進行水平或垂直擴展,在某些情況下,僅通過垂直平面規(guī)劃就能提高性能。
但是,考慮到云計算和邊緣技術(shù)的巨大商機,特別是人工智能在各地的推廣,三大代工廠及其生態(tài)系統(tǒng)正在競相開發(fā)新的功能和特性。在某些情況下,這需要利用他們已有的技術(shù)。在其他情況下,則需要全新的技術(shù)。
例如,三星已經(jīng)開始詳細介紹有關(guān)定制HBM的計劃,其中包括3D DRAM堆棧及其下的可配置邏輯層。這是第二次采用這種方法。早在2011年,三星和美光就共同開發(fā)了混合內(nèi)存立方體(HMC),將DRAM堆棧封裝在一層邏輯層上。在JEDEC將HBM變成標準后,HBM贏得了這場戰(zhàn)爭,而HMC則基本消失了。但是,HMC方法除了時機不對之外,并沒有其他問題。
在新形式下,三星計劃提供定制的HBM作為選項。內(nèi)存是決定性能的關(guān)鍵因素之一,在內(nèi)存和處理器之間更快地讀寫和來回移動數(shù)據(jù)的能力會對性能和功耗產(chǎn)生很大影響。如果內(nèi)存的大小適合特定的工作負載或數(shù)據(jù)類型,而且部分處理工作可以在內(nèi)存模塊內(nèi)完成,從而減少需要移動的數(shù)據(jù),那么這些數(shù)據(jù)就會大大提高。
與此同時,英特爾正在研究一種更好的方法,為密集的晶體管提供電源,隨著晶體管密度和金屬層數(shù)的增加,這將是一個長期存在的問題。過去,電源是從芯片頂部向下輸送的,但在最先進的節(jié)點上出現(xiàn)了兩個問題。其一是如何為每個晶體管提供足夠的功率。其二是噪聲,噪聲可能來自電源、基板或電磁干擾。噪聲需要屏蔽,但由于電介質(zhì)和電線越來越薄,這在每個新節(jié)點上都變得更加困難。如果沒有適當?shù)钠帘,噪聲會影響信號完整性?/P>
通過芯片背面供電可最大限度地減少此類問題,并減少布線擁塞。但這也增加了其他挑戰(zhàn),包括如何在不破壞結(jié)構(gòu)的情況下在更薄的基板上鉆孔。英特爾顯然已經(jīng)解決了這些問題,計劃今年提供PowerVia背面供電方案。
臺積電表示,計劃于2026/2027年在A16工藝提供背面供電。三星的計劃也大致相同,將在SF2Z(2nm)工藝中實現(xiàn)。
英特爾還宣布了玻璃基板計劃,玻璃基板比CMOS具有更好的平面度和更低的缺陷率。這在先進節(jié)點上尤為重要,因為即使是納米級的凹坑也會造成問題。與背面供電一樣,玻璃基板的處理問題也層出不窮。好的一面是,玻璃的熱膨脹系數(shù)與硅相同,因此它與硅元件(如Chiplet)的膨脹和收縮兼容。經(jīng)過多年的觀望,玻璃突然變得非常有吸引力。事實上,臺積電和三星都在研究玻璃基板,整個行業(yè)都開始使用玻璃進行設(shè)計、處理玻璃而不使其破裂,并對玻璃進行檢測。
與此同時,臺積電非常重視生態(tài)系統(tǒng)的建設(shè)和工藝產(chǎn)品的拓展。許多業(yè)內(nèi)人士表示,臺積電的真正優(yōu)勢在于能夠為幾乎任何工藝或封裝提供工藝開發(fā)套件。據(jù)報道,臺積電生產(chǎn)了全球約90%的最先進芯片,在先進封裝方面的經(jīng)驗也是所有代工廠中最豐富的,而且擁有最大、最廣泛的生態(tài)系統(tǒng),這一點非常重要。
該生態(tài)系統(tǒng)至關(guān)重要。芯片行業(yè)是如此復(fù)雜多變,沒有一家公司能做到面面俱到。未來的問題將是這些生態(tài)系統(tǒng)的真正完整程度,尤其是在工藝數(shù)量持續(xù)增長的情況下。例如,電子設(shè)計自動化(EDA)供應(yīng)商是必不可少的推動者,任何工藝或封裝方法要想取得成功,設(shè)計團隊都需要自動化。但是,工藝和封裝選項越多,EDA供應(yīng)商就越難支持每一個增量變化或改進,而且從發(fā)布到交付之間的滯后時間也可能越長。
結(jié)論
考慮到最近的供應(yīng)鏈問題和地緣政治,美國和歐洲認為,需要重新進行“離岸生產(chǎn)”和“友岸外包”。對半導(dǎo)體工廠、設(shè)備、工具和研究的投資是前所未有的。這對三家最大的代工廠有何影響還有待觀察,但這無疑為共封裝光學(xué)(CPO)、大量新材料和低溫計算等新技術(shù)提供了一些動力。
所有這些變化對市場份額的影響越來越難以追蹤。這已不再是哪家代工廠以最小的工藝節(jié)點生產(chǎn)芯片的問題,甚至也不再是芯片出貨量的問題。一個先進的封裝可能有幾十個Chiplet。真正的關(guān)鍵是能否快速、高效地提供對客戶至關(guān)重要的解決方案。在某些情況下,驅(qū)動因素是每瓦性能,而在另一些情況下,則可能是時間結(jié)果,功率是次要考慮因素。還有一些情況下,可能是多種功能的組合,而只有其中一家領(lǐng)先的代工廠才能提供足夠數(shù)量的這些功能。但顯而易見的是,代工廠的競爭比以往任何時候都要復(fù)雜得多,而且變得越來越復(fù)雜。在這個高度復(fù)雜的世界里,簡單的比較標準已不再適用。