蘋果UltraFusion連接技術是如何實現(xiàn)史上最強PC芯片的?
3月9日,蘋果發(fā)布了一款顛覆性的產品 —— M1 Ultra芯片,不管是宣傳上還是工藝上,都能夠看出蘋果對它寄予了厚望。
本文引用地址:http://www.biyoush.com/article/202203/432093.htmM1 Ultra采用了蘋果創(chuàng)新性的UltraFusion封裝架構,通過兩顆M1 Max晶粒的內部互連,打造出一款性能與實力都達到空前水平的SoC芯片,可為全新的Mac Studio提供令人震撼的算力,同時依然保持著業(yè)內領先的能耗比水平。
M1 Ultra性能如何?
M1 Ultra支持高達128GB的高帶寬、低延遲統(tǒng)一內存,晶體管數(shù)量達到了驚人的1140億個,每秒可運行高達22萬億次運算,提供的GPU性能是蘋果M1芯片的8倍。使用它處理多線程任務的速度,相比市面上功耗范圍相近的16核臺式個人電腦芯片中速度最快的型號(英特爾 i9-12900k)還要高出90%之多。
相比市面上以10核心設計的桌機處理器,蘋果強調M1 Ultra可降低65%電功耗,相比16核心設計的處理器則可在相同瓦數(shù)提升最高90%,最高約可精簡100W電力損耗,而相較市面最普遍使用的GPU更僅需三分之一電力運作,相比最高階的GPU(英偉達 RTX 3090)更可降低200W電力損耗,蘋果更強調M1 Ultra處理器提供市面目前最高的每瓦效能表現(xiàn)。
不同于M1 Pro、M1 Max的多種規(guī)格,簡單芯片加倍的M1 Ultra共有兩種規(guī)格,與之對應的就是砍半的M1 Max。
· 20核心CPU、48核心GPU、32核心神經引擎、64GB統(tǒng)一內存
· 20核心CPU、64核心GPU、32核心神經引擎、128GB統(tǒng)一內存
M1 Ultra的媒體引擎性能是M1 Max的兩倍,提供了前所未有的ProRes視頻編解碼吞吐量。事實上,搭載了M1 Ultra的Mac Studio最多可以播放18條8K ProRes 422視頻流,這是其他芯片無法做到的。
M1 Ultra還集成了一系列其他定制化蘋果技術,例如能夠驅動多個外部顯示器的顯示引擎、集成的Thunderbolt 4控制器和一流的安全性能,包括蘋果最新的Secure Enclave功能、硬件驗證的安全啟動和運行時反漏洞利用技術。
M1 Ultra完善了M1系列芯片,并憑借強大的CPU、GPU、不可思議的神經引擎、ProRes硬件加速和巨量統(tǒng)一內存,成為了世界上最強大的個人計算機芯片。依照蘋果硬件部門資深副總裁Johny Srouji說明,M1 Ultra將是M1系列最后一款產品,但蘋果并未說明是否還有其他組合可能性。
開創(chuàng)性的UltraFusion
眾所周知,要做更強大的芯片,就需要堆更多的電路,更多的晶體管,而工藝越先進,同樣的面積就能塞進去更多晶體管,芯片性能上限就越高,這也是為何大家追求更先進制程的原因之一。
在造芯之路上“狂奔”十余載的蘋果,面對物理工藝節(jié)點即將達到物理極限,此次的突破點是什么?蘋果芯片設計師用了「1+1」的方案暫時解決了目前芯片所面臨的設計難題 —— 1 Ultra = 2 Max,M1成了計量單位。
在如今新制程升級困難、良率降低,芯片速度增長緩慢的情況下,“合二為一”的方法在大幅提高算力的同時提高了良率,使得大芯片價格不至于指數(shù)級增長,看起來是個有效的升級方式。
從成本上來說,業(yè)界分析稱蘋果M1 Ultra單顆造價約300 美元~350美元。顯著低于英特爾Xeon處理器,較英特爾最新Core-i9-10980XE 18核心處理器價格超過1000美元,蘋果M1 Ultra的性價比更高。
提升性能最常用的做法,是通過主板來連接兩枚芯片,但這通常伴隨著許多弊端,包括延遲增加、帶寬減少、功耗增加等。而M1 Ultra是將兩枚M1 Max芯片的晶粒直接連接在一起,背后的關鍵技術即是蘋果創(chuàng)新定制的封裝架構UltraFusion。其實,UltraFusion功能位置早已內置于之前發(fā)布的蘋果M1 Max芯片中,但直到3月的蘋果Peek Performance活動才被明確提出。
它可同時傳輸超過10000個信號,從而實現(xiàn)高達2.5TB/s低延遲處理器互聯(lián)帶寬,相比業(yè)內領先的高端多芯片,實現(xiàn)了4倍多的互聯(lián)帶寬。這種架構能讓M1 Ultra在工作時依然表現(xiàn)出一枚芯片的整體性,也會被所有軟件識別為一枚完整芯片,開發(fā)者無需重寫代碼就能直接運用它的強大性能。這在史上從無先例。
從M1 Ultra發(fā)布的UltraFusion圖示可以看到,蘋果M1 Ultra應該是采用臺積電基于第五代CoWoS Chiplet技術的互連架構,透過硅中間層(Silicon Interposer)與微型凸塊(Micro-Bump),將兩組M1 Max彼此連接。
Chip-on-Wafer-on-Substrate with Si interposer(CoWoS-S)是一種基于TSV的多芯片集成技術,廣泛應用于高性能計算(HPC)和人工智能(AI)加速器領域。
隨著CoWoS的進步,可制造的中介層(Interposer)面積穩(wěn)步增加,從一個全掩模版尺寸(大約830mm2)到兩個掩模版尺寸(大約1700mm2)。中介層的面積決定了最大的封裝后的芯片的面積。
第5代CoWoS-S(CoWoS-S5)達到了大至三個全光罩尺寸(~2500mm2)的水平。通過雙路光刻拼接方法,該技術的硅中介層可容納1200mm2的多個邏輯芯粒和八個HBM(高帶寬內存)堆棧。芯粒與硅中介層的采用面對面(Face to Face,互連層與互連層對接)的連接方式。
在UltraFusion技術中,通過使用裸片縫合(Die Stitching)技術,可將4個掩模版拼接來擴大中介層的面積。在這種方法中,4個掩模被同時曝光,并在單個芯片中生成四個縫合的“邊緣”。
根據(jù)蘋果公司的專利顯示,在這一技術中,片間互連可以是單層金屬,也可以是多層金屬。
UltraFusion不僅僅是簡單的物理連接結構。在這一封裝架構中,有幾項特別優(yōu)化過的技術。
· 低RC互連:在UltraFusion中,有新的低RC(電容x電阻=傳輸延遲)金屬層,以在毫米互連尺度上提供更好的片間信號完整性。與傳統(tǒng)的多芯片模塊(MCM)等其他封裝解決方案相比,UltraFusion的中介層在邏輯芯粒之間或邏輯芯粒和存儲器堆棧之間提供密集且短的金屬互連。片間完整性更好,且能耗更低,并能以更高的時鐘速率運行。這種新的中介層互連方案將走線電阻和通孔電阻降低了50%以上。
· 互連功耗控制:蘋果的專利顯示,UltraFusion使用了可關閉的緩沖器(Buffuer),進行互連緩沖器的功耗控制,有效降低暫停的互連線的能耗。
· 優(yōu)化TSV高縱橫比的硅通孔(TSV)是硅中介層技術另一個非常關鍵的部分。UltraFusion/CoWoS-S5重新設計了TSV,優(yōu)化了傳輸特性,以適合高速SerDes傳輸。
· 集成在中介層的電容(iCAP):UltraFusion在中介層集成了深溝槽電容器(iCap),幫助提升芯片的電源完整性。集成在中介層的電容密度超過300nF/mm2,幫助各芯粒和信號互連享有更穩(wěn)定的供電。
· 新的熱界面材料:UltraFusion通過集成在CoWoS-S5中的新型非凝膠型熱界面材料(TIM),熱導率>20W/K,覆蓋率達到100%,為各個高算力芯粒提供更好的散熱支持,從而增強整體散熱。
· 通過Die-Stitching技術有效提升封裝良率降低成本:UltraFusion中,僅將KGD(Known Good Die)進行鍵合,這樣避免了傳統(tǒng)的WoW(Wafer on Wafer)或CoW(Chip on Wafer)中失效的芯粒被封裝的問題,進而提升封裝后的良率,降低了整體的平均成本。(壞的芯片越少,在固定的流片和研發(fā)費用前提下,單芯片平均成本就越低)
UltraFusion充分結合了封裝互連技術、半導體制造和電路設計技術,為整合面積更大、性能更高的算力芯片提供了巨大的想象空間,為計算架構的發(fā)展提供了非常好的助力和參照。同時,M1 Ultra的成功,會讓傳統(tǒng)的芯片制造商,感受到更大的壓力。
Chiplet設計將成為行業(yè)主流
在當下的半導體行業(yè)中,Chiplet設計已經成為行業(yè)主流,成為快速制造芯片同時降低制造成本的關鍵。目前,這項技術被用于數(shù)據(jù)中心服務器和高端臺式機的芯片,并在這些產品中提高了大型芯片的經濟性。
Chiplet的優(yōu)勢便是降低成本,擺脫對先進工藝節(jié)點的依賴,甚至可以彎道超車。不過Chiplet是將芯片2D、3D堆疊,對于熱管理設計和熱功耗的控制更為嚴格。M1 Ultra成型的理念有些類似Chiplet技術。不同的是Chiplet更多是運用舊工藝(如7nm芯片),小型化的芯片(CPU),利用先進的封裝工藝進行混裝,靈活度很高。
近日,臺積電、英特爾、高通、三星、Arm、AMD和日月光等十大廠商成立了UCIe(UniversalChiplet Interconnect Express,通用芯?;ミB技術)標準聯(lián)盟,藉此擴大推動Chiplet技術應用生態(tài)。而同時,業(yè)界熱議,為何蘋果沒有加入該聯(lián)盟?
M1 Ultra芯片的問世,使得蘋果芯片再次刷新了行業(yè)認知。讓人們意識到,在先進封裝方面,蘋果無意加入該聯(lián)盟,因為UltraFusion技術已經達到業(yè)內頂尖水平,遠遠超出了UCIe 1.0的標準。
M1 Ultra是蘋果野心的進一步延續(xù),連最有錢的蘋果也轉向Chiplet了,這預示著也許未來在消費級領域,高性能產品走Chiplet這條路可以走得通。
對于產業(yè)來說,Chiplet帶來了新的機會,在標準與生態(tài)層次上,Chiplet建立了新的可互操作的組件、互連協(xié)議和軟件生態(tài)系統(tǒng);對于芯片制造與封裝來說,增設了多芯片模塊(Multi-Chip Module,MCM)業(yè)務,Chiplet迭代周期遠低于ASIC,可提升晶圓廠和封裝廠的產線利用率;對于半導體IP來說,升級為Chiplet供應商,可提升IP的價值且有效降低芯片客戶的設計成本;最后對于芯片設計來說,降低了大規(guī)模芯片設計的門檻。
評論