Tesla的晶圓級Dojo處理器已投入生產(chǎn)
上周臺積電北美技術(shù)研討會上不太引人注目的花絮之一是,特斯拉宣布用于人工智能訓練的 Dojo 晶圓系統(tǒng)處理器現(xiàn)已投入量產(chǎn),并有望很快部署。有關(guān)巨型處理器的更多細節(jié)在活動中公布。
Tesla 的Dojo 晶圓上系統(tǒng)處理器(或者 Tesla 稱之為 Dojo Training Tile)依賴于放置在載體晶圓并使用臺積電的集成扇出 (InFO) 技術(shù)進行晶圓級互連 (InFO_SoW) 互連。據(jù)IEEE Spectrum報道,InFO_SoW 技術(shù)旨在實現(xiàn)高性能連接,使得 Tesla Dojo 的 25 個芯片可以像單個處理器一樣工作 。同時,為了使晶圓級處理器保持一致,臺積電用虛擬芯片填充了芯片之間的空白點。
由于 Tesla Dojo Training Tile 本質(zhì)上包含 25 個超高性能處理器,因此它非常耗電,并且需要復雜的冷卻系統(tǒng)。為了給晶圓上系統(tǒng)供電,特斯拉使用了高度復雜的電壓調(diào)節(jié)模塊,為計算平面提供 18,000 安培的電力。后者散發(fā)的熱量高達 15,000W,因此需要液體冷卻。
特斯拉尚未透露其 Dojo 晶圓系統(tǒng)的性能——不過,考慮到其開發(fā)過程中面臨的所有挑戰(zhàn),它似乎有望成為人工智能訓練的一個非常強大的解決方案。
晶圓級處理器,例如 Tesla 的 Dojo 和 Cerebras 的晶圓級引擎 (WSE),比多處理器機器的性能效率要高得多。它們的主要優(yōu)點包括內(nèi)核之間的高帶寬和低延遲通信、降低的電力傳輸網(wǎng)絡(luò)阻抗以及卓越的能源效率。此外,這些處理器可以受益于擁有冗余的“額外”核心——或者,對于特斯拉來說,擁有已知良好的處理器核心。
但目前此類處理器還存在固有的挑戰(zhàn)。晶圓系統(tǒng)目前必須專門使用片上存儲器,這不靈活,而且可能不足以滿足所有類型的應(yīng)用。這個問題將通過名為 CoW_SoW 的下一代晶圓上系統(tǒng)平臺來解決 ,該平臺將支持在處理器塊上進行 3D 堆疊 和 HBM4 內(nèi)存安裝。
目前,只有Cerebras和 Tesla 擁有晶圓上系統(tǒng)設(shè)計。但臺積電確信,隨著時間的推移,更多的人工智能和高性能計算處理器開發(fā)商將構(gòu)建晶圓級設(shè)計。
來源:半導體行業(yè)觀察
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。