巨頭們發(fā)力先進封裝
來源:電子與封裝
今年,筆者參加了 2022 年 IEEE 第 72 屆電子元件和技術會議。在這里,我們將討論的重點包括臺積電的 CoWoS-R+、臺積電的第四代 SoIC(3 微米間距混合鍵合)、英特爾和 CEA-LETI 自對準集體(collective)裸片到晶圓混合鍵合、三星對包括混合鍵合在內的monolithic vs MCM vs 2.5D vs 3D 的研究。以及SK海力士、美光和聯(lián)發(fā)科等在先進封裝方面的研究。
臺積電的 CoWoS-R+
臺積電并沒有止步于 CoWoS R,CoWoS-R+ 在這項技術上不斷發(fā)展。
要理解的關鍵概念之一是die-to-die連接的距離。HBM 是目前將AI 和高性能計算的內存帶寬提高到合理水平的唯一方法。隨著最初的 HBM 以每個pad 1Gbps 的速度出現(xiàn),現(xiàn)在的HBM2 和 HBM2E 一代迅速增長到 2.4Gbps 和 3.2Gbps。HBM3 將一路達到 6.4Gbps。封裝寬度也從 HBM2 的 7.8mm 增長到 HBM2E 的 10mm 到 11mm,這意味著互連長度現(xiàn)在增長到大約 5.5。
簡而言之,“線”需要傳輸更快的數(shù)據速率,同時還要走更長的距離。這是非常難以做到的,并且會產生大量噪聲,從而降低信號完整性。
另一個問題是,隨著摩爾定律的放緩與日益增長的性能需求作斗爭,芯片的功率正在爆炸式增長。Nvidia 的 Hopper 已經擁有 700W的功率,但未來封裝將激增至千瓦級。HBM3 也比 HBM2E 更耗電。通過封裝的更多功率也可能會產生更多噪聲,從而降低信號完整性。
臺積電開發(fā)了一種新的高密度 IPD 來解決這個問題。簡而言之,臺積電客戶可以在 CoWoS R+ 上實現(xiàn) 6.4Gbps HBM3,但在 CoWoS R 上卻不行。高密度 IPD 對于增加額外電容以平滑供電很重要。如Graphcore 就是在使用臺積電的SoIC混合鍵合之后,在不大幅提高功耗的情況下,將產品的時鐘提升了40%。
臺積電還分享了mbedded bridge die的更多發(fā)展。該橋與頂部有源芯片之間的互連可以降至 24 微米。臺積電現(xiàn)在可以實現(xiàn)與 CoWoS-S(全無源硅中介層)相匹配的 3 倍reticle限制。未來,他們的路線圖將達到 45 倍reticle尺寸,這意味著使用chip last工藝的復雜芯片可用于晶圓級封裝。與此同時,CoWoS-S 僅在明年擴展至 4 倍。
臺積電第 4 代 SoIC,實現(xiàn) 3 微米間距混合鍵合
臺積電的混合間和的過程大致相同。他們從完成的晶圓開始,形成一個新的bonds pad,蝕刻它,沉積一個seed層,電鍍。接下來,他們對頂部die晶圓進行減薄和切割。特別注意保持它們的清潔。完成等離子激活,并粘合die。
臺積電的論文展示了 SoIC 的良率,這非常有趣。這是在尺寸為 6mm x 6mm 的測試裸片上使用菊花鏈測試(daisy chain test )結構,這和 AMD 的 V-Cache 的裸片尺寸一樣方便。
晶圓上芯片(chip on wafer )混合鍵合中最慢的步驟之一是——BESI 工具物理地拾取die并將其放置在底部晶圓上。這個綁定步驟嚴重影響準確性,吞吐量與準確性是一場非常大的戰(zhàn)斗。具有 3 微米 TSV 間距的臺積電展示的良率沒有差異,電阻在小于 0.5 微米的未對準時沒有顯著變化,鍵合良率達到 98%。
從 0.5 微米到 1 微米,它們的良率確實提升了了,但它們的菊花鏈結構的最后 10% 的電阻急劇增加。間距大于 1 微米,它們的良率為 60%,所有測量的結構都超過了它們的電阻規(guī)格。0.5 微米是一個非常重要的水平,因為 BESI 聲稱其 8800 Ultra 工具的精度小于 200 納米,盡管我們聽說它更像是 0.5 微米,具有很大的差異,即使吞吐量是工具額定規(guī)格的一半。
臺積電還展示了更薄的阻擋層(thinner barrier layer),這也讓整個堆棧的接觸電阻(contact resistance)更好。此外,臺積電認為 SoIC 更可靠。這包括更廣泛的工作溫度范圍。但當 AMD 完全在其 5800X3D 臺式機芯片上鎖定超頻和修改功率時,許多人感到失望。這可能只是第一代的一個小問題。由于 TSMC 的 Cu 合金進行了改進,并且隨著 SoIC gen 4 間距減小,它們似乎正在提高其可靠性和良率。
英特爾和 CEA-LETI的Collective Die to Wafer混合鍵合
英特爾和 CEA-LETI 將Collective Die to Wafer與自對準技術相結合,實現(xiàn)了 150 納米的平均未對準(mean misalignment,比die to wafer更準確)并具有更高的吞吐量。自對準技術非??帷K麄兝盟蔚拿氉饔昧υ谛薷暮蟮氖叭『头胖霉ぞ邔⑵淇焖俚惶珳蚀_地放置在所需位置后使對齊更加準確。隨著水的蒸發(fā),產生直接鍵合,無需任何其他中間材料。然后,鍵合晶片進入標準退火步驟,加強鍵合。
除了水滴沉積(water droplet )之外,唯一獨特的步驟是在粘合部位應用親水和疏水材料,這可以用納米覆蓋精度進行光刻定義。這不是一個沒有問題的過程。有許多與分配水、液滴特性、冷凝和粘合過程有關的問題。英特爾和 CEA-LETI 以 3 個指標展示了結果。Collection Yield是指在die上捕獲的水滴。Bonding yield 是指成功鍵合的dies數(shù)量。Alignment yield是指具有亞微米精度的die數(shù)量。
他們嘗試了各種工藝的矩陣,其最好的方法實現(xiàn)了 98% 的bond yiled和 100% 的其他步驟??倢示攘钊梭@嘆,所有die的對準精度都低于 1 微米,大多數(shù)die的對準精度低于 0.2 微米。英特爾和 CEA-LETI 嘗試使用多種不同的die尺寸實現(xiàn)這一點,這個過程在非常高的縱橫比die上非常出色,這非常有趣。
三星 Monolithic vs MCM vs 2.5D vs 3D,包括混合鍵合
用于 HPC 和 AI 的單片 2D 芯片的面積為 450平方毫米。它被切成薄片(sliced up)并使用先進的封裝將其粘合在一起。MCM 變體的功耗增加了 2.1%,芯片面積增加了 5.6%。2.5D設計,功率提升1.1%,面積增加2.4%。3D 設計的功率增加了 0.04%,但面積增加了 2.4%。這些結果當然是理想的,在現(xiàn)實世界中,與布局規(guī)劃和布局問題相關的開銷會更多。
SK 海力士 Wafer On Wafer 混合鍵合 DRAM
ASE 共封裝光學器件
引線鍵合一直是 100G 一代產品的主要技術,但隨著我們過渡到 400G 和 800G 代,它開始成為瓶頸。這是其他公司一段時間以來一直在進行的過渡,例如英特爾和 Fabrinet 已停止將 PIC 和 EIC 與最近幾代產品進行引線鍵合。思科也已經從引線鍵合轉向倒裝芯片,今年他們甚至展示了使用 TSV 的 3D 組裝,這比 ASE 展示的要先進得多。
ASE 論文總體上討論了光學制造的獨特挑戰(zhàn),包括contamination processes 的差異以及所使用的獨特切割和蝕刻技術。晶圓廠后的晶圓工藝也不同,例如凸點下金屬化和硅等。還討論了獨特的測試要求。ASE 進入光學制造領域還有很長的路要走,但重要的是要繼續(xù)關注它們,將其視為電信和數(shù)據中心市場光學組裝和封裝領域潛在的非常有能力和可怕的新進入者。
超薄die的 Xperi Die Handling
Tokyo Electron Wafer on Wafer Hybrid Bonding
索尼領先的 1 微米間距混合鍵合
他們于 2017 年首次在大批量產品中交付該技術。他們目前每年交付數(shù)百萬個 CMOS 圖像傳感器,采用 6.3 微米間距混合鍵合,堆疊 3 個裸片,而其他人的間距和體積要小得多。索尼的產品完全是晶圓對晶圓的混合鍵合。今年索尼推出了 1 微米間距面對面混合鍵合和 1.4 微米面對面混合鍵合。索尼目前使用面對面和面對面的混合鍵合。
索尼為何在混合鍵合上如此激進的簡短解釋是,索尼希望繼續(xù)分解和堆疊圖像傳感器像素的功能,以捕捉更多光線,并能夠捕捉更多數(shù)據并將其轉化為實際照片和視頻。
他們展示的技術非常有趣。所有混合鍵合工藝都需要極其平坦的表面,但在 CMP 工藝中銅和 SiO2 會以不同的速率被拋光掉。在大多數(shù)工藝中,這意味著銅會被磨掉到比 SiO2 低的水平。這通常稱為dishing。這個過程必須精確控制,因為 SiO2 和銅的熱膨脹系數(shù)也不同。臺積電使用的一項技術是使用銅合金代替純銅來控制凹陷程度并使 CMP 工藝更容易進行。
索尼,因為他們縮小到比行業(yè)其他公司小得多的間距,所以提出了相反的策略。在他們的先進方法中,SiO2 比銅被拋光得更遠。這需要完全不同的專有 CMP 工藝。
索尼還通過改變 ECD 工藝中的晶粒尺寸實現(xiàn)了對銅的類似控制和突出。
結果令人難以置信。與傳統(tǒng)工藝相比,接觸電阻提高了多個數(shù)量級。這是在 200,000 個菊花鏈(daisy chained) Cu-Cu 連接上進行測試的。這些是 1 微米面對面鍵合的結果,但 1.4 微米面對面粘合也顯示出令人印象深刻的結果。
AMD Zen 3 上的 V-Cache SoIC 混合鍵合
v-cache 的物理結構非常有趣。AMD 和 TSMC 不僅是 CPU CCD 小芯片,頂部還有 SRAM 小芯片和支持小芯片,而且還在整個組件的頂部有最后的第 5 塊支持硅片。這種結構由IBM 的 Tom Wassick獨立證實。
起初,這似乎是在浪費額外的硅,但這樣做是因為臺積電的混合鍵合工藝需要減薄的裸片。需要最后一塊支撐硅片來為沒有混合鍵合 SRAM 的標準 CCD 提供最終的芯片組件剛度和等效高度。
AMD 將 9 微米間距混合鍵合與 36 微米間距微凸塊 3D 架構進行了比較。
AMD 指的是將用于 Ponte Vecchio GPU 和 Meteor Lake CPU 的 Foveros。AMD 聲稱,由于 TSV 和接觸電容/電感更低,互連能效提高了 3 倍,互連密度提高了 16 倍,信號/電源完整性也更好。奇怪的是,他們使用 9 微米間距作為比較。這是一個不誠實的比較,因為TechInsights發(fā)現(xiàn) V-Cache 的生產版本是在 17 微米間距上完成的。這種音調上的放松會減少所呈現(xiàn)的一些優(yōu)勢。
這張圖表很有趣,盡管非常籠統(tǒng)。Zen 3 有 32MB 的 L3 Cache,V-Cache 為每個小芯片增加了 64MB。目前只堆疊了 1 個小芯片,這導致 IPC 的大范圍增加。我想知道 AMD 使用什么模擬和基準測試來獲得這個 IPC % Uplift 數(shù)據。AMD 還展示了一些與可靠性相關的數(shù)據,這表明在正常電壓下沒有問題。
聯(lián)發(fā)科網絡 SOC 可靠性
聯(lián)發(fā)科也沒有直接說明,但我們知道他們使用了臺積電的 InFO-oS 技術。這篇論文討論了溫度、翹曲和其他可靠性問題,但有趣的是他們宣傳了這款芯片。
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。