算力革命時代,EDA如何破局?
在金融服務(wù)、智能制造、醫(yī)療保健以及媒體娛樂等行業(yè)的推動下,全球數(shù)據(jù)呈現(xiàn)爆發(fā)態(tài)勢。根據(jù)IDC Global DataSphere的研究顯示,2020年-2025年,全球數(shù)據(jù)總量將從59ZB大幅增長至175ZB。其中,中國增速最快且體量最大,預(yù)計到2025年數(shù)據(jù)總量將增至48.6ZB,全球市占比達到27.8%。
在海量的數(shù)據(jù)面前,如何更好地處理數(shù)據(jù)并挖掘其背后的意義?數(shù)據(jù)中心被賦予了更高的使命。面對日益激增的數(shù)據(jù)浪潮,傳統(tǒng)的堆硬件式計算服務(wù)器模式已經(jīng)不堪負重,與此同時,曾經(jīng)在軍事、科研等高精尖領(lǐng)域發(fā)揮重要價值的HPC,正在開啟一場面向各行各業(yè)的新算力革命。
全球正在進入HPC大周期
那么到底什么是HPC呢?HPC是英文High Performance Computing的縮寫,中文譯為高性能計算。高性能計算主要是通過多臺服務(wù)器并行計算的方式,來提升整體的計算能力和容錯能力。在此基礎(chǔ)上,各個節(jié)點可以共同解決一個比任何一個節(jié)點單獨完成的問題大得多的問題,從而達到“1+1>2”的效果。
未來幾年,數(shù)字化轉(zhuǎn)型、云計算和AI等應(yīng)用將推動高性能計算滲透率加速提升,屆時全球?qū)⒅鸩竭M入高性能計算的大周期。根據(jù)TrendForce的預(yù)測顯示,2021年-2027年,全球HPC市場規(guī)模將從368億美元增長至 568億美元,年均復(fù)合增長率達到7.5%。
HPC的高速發(fā)展對底層芯片提出了新的要求
一個完整的計算機系統(tǒng),通常由硬件系統(tǒng)和軟件系統(tǒng)兩大部分組成,其中硬件是計算機系統(tǒng)運行的基石,而硬件由各種各樣的芯片集合組成。這意味著在高性能計算高速發(fā)展的時代,對CPU、GPU、TPU、NPU、FPGA、ASIC、SoC等高性能計算芯片,以及通信芯片、接口芯片、存儲芯片等的需求量有望持續(xù)上升。
在百億級市場的積極驅(qū)動下,各大主流芯片企業(yè)皆紛紛入局高性能計算市場并加大投入,以期望在市場紅利期分得一塊蛋糕。
對于高性能計算來說,算力是第一要素,通常需要達到每秒萬億次級的計算速度,這對系統(tǒng)的處理器、內(nèi)存帶寬、運算方式、系統(tǒng) I / O、存儲等都提出了更高的要求。如何解決構(gòu)建下一代超級計算機面臨的性能、延遲、功耗及安全性問題,成為了行業(yè)關(guān)注的重點。
系統(tǒng)性的挑戰(zhàn)同樣存在于硬件層面,對于高性能計算芯片來講,面對的計算任務(wù)越是復(fù)雜,系統(tǒng)對其計算能力、計算速度、數(shù)據(jù)存儲和帶寬等方面的要求就越高。為了能在這場“算力革命”中獲得競爭優(yōu)勢,越來越多的芯片研發(fā)企業(yè)開始采用Chiplet和多die互聯(lián)的技術(shù)將模塊化設(shè)計的思維引入半導(dǎo)體制造和封裝中,以獲得更高的計算密度、更多的計算接口和更高的芯片良率;同時采用DDR5 / HBM2e內(nèi)存處理、PCIe Gen6 / CXL2.0 / UCIe 高速接口,以應(yīng)對更高的存儲需求;此外,他們還在嘗試盡量縮短自家產(chǎn)品的面世時間,以獲得市場先發(fā)優(yōu)勢。
面對挑戰(zhàn),EDA如何助力大芯片產(chǎn)業(yè)成功破局?
那么,對于這些芯片企業(yè)而言,如何才能實現(xiàn)更大的產(chǎn)品競爭力,加速產(chǎn)品上市呢?正所謂“欲善其事,必先利其器”,因此若想在市場提高競爭力,首先要有更好的EDA工具,其次要有更多、更成熟的芯片設(shè)計模塊儲備,最后要有強有力的市場推廣渠道和生態(tài)建設(shè)能力。
就EDA工具而言,高性能計算芯片的設(shè)計呈現(xiàn)出異構(gòu)化和系統(tǒng)化趨勢,傳統(tǒng)的EDA工具已經(jīng)不能滿足市場所需。怎么理解呢?
芯片設(shè)計異構(gòu)化
在過去幾年中,新的體系結(jié)構(gòu)和指令集在崛起,異構(gòu)成為提升算力的重要實現(xiàn)手段,這種趨勢不僅體現(xiàn)在設(shè)計中,還體現(xiàn)在制造領(lǐng)域,用不同的工藝、不同的節(jié)點、不同廠家的IP來實現(xiàn)整個SoC芯片。
芯片設(shè)計系統(tǒng)化
一方面,在過去三十年中,半導(dǎo)體產(chǎn)業(yè)的設(shè)計和制造是分離的,而如今異構(gòu)的趨勢又在某種程度上將兩者重新統(tǒng)一起來了,因此EDA工具必須在設(shè)計階段就考慮好如何滿足chiplet系統(tǒng)的驗證需求,這種上下游的協(xié)同要求EDA從設(shè)計階段延伸到系統(tǒng)階段,來覆蓋整個應(yīng)用創(chuàng)新周期的驗證需求,以及需要有一個統(tǒng)一的流程來實現(xiàn)不同環(huán)節(jié)的互相驗證、互相對比,以達成某種程度上的協(xié)同;另一方面,近年來越來越多的系統(tǒng)廠商為了提升自身的差異化優(yōu)勢,也紛紛開始投入芯片研發(fā),這些廠商會將他們對系統(tǒng)的理解帶到了芯片定義中去,就勢必會牽涉到軟件和硬件的協(xié)同、多顆芯片和多個節(jié)點的協(xié)同等。
針對異構(gòu)芯片的設(shè)計和驗證挑戰(zhàn),Cadence擁有一系列成熟的IP、仿真速度更快、容量更大的EDA工具和智能化的驗證平臺。其中,Cadence Design IP提供了高性能、低延遲的網(wǎng)絡(luò)基礎(chǔ)設(shè)施和存儲解決方案,包括40G UltraLink D2D PHY、112G - XSR PAM4 IP、UCIe? PHY and Controller、DDR / LPDDR / HBM Phy and Controller等,芯片設(shè)計企業(yè)借助這些IP可以減少大芯片設(shè)計和迭代的總投入成本,同時縮短產(chǎn)品的上市時間;而Cadence Xcelium MC / ML、Verisium AI、Jasper SPV、Dynamic Duo(Palladium / Protium)等EDA工具則可以加快整體仿真速度,輔助企業(yè)實現(xiàn)快、準(zhǔn)、好的硬件加速和原型驗證。
針對芯片設(shè)計系統(tǒng)化趨勢,Cadence System Performance Analyzer可以幫助芯片設(shè)計企業(yè)識別典型SoC的內(nèi)存子系統(tǒng)、互連和外圍設(shè)備中的性能下降原因,同時管理和監(jiān)控系統(tǒng)內(nèi)各種啟動器的相互沖突的性能目標(biāo),分析和解決系統(tǒng)性能瓶頸;而Cadence Helium virtual platform可以通過驗證和調(diào)試嵌入式軟件/固件,以及在系統(tǒng)級芯片的純虛擬和混合配置上啟動操作系統(tǒng),從而幫助芯片設(shè)計企業(yè)加速系統(tǒng)級芯片的開發(fā),實現(xiàn)由軟件驅(qū)動的軟硬件協(xié)同驗證。
此外,針對邊緣計算的低功耗和熱需求,Cadence還提供了Palladium DPA、 Xcelium Powerplay back、Joules + Innovus power analysis and optimization等工具,從而能夠更快、更精確地實現(xiàn)動態(tài)功耗分析、峰值功耗估計等。針對從邊緣到云端的數(shù)據(jù)中心和IoT應(yīng)用,Cadence SBSA提供了Arm System Ready架構(gòu)認證解決方案。針對計算密度增加帶來的芯片規(guī)模超出光罩尺寸的問題,Cadence Integrity 3D-IC平臺可以提供更好的3D-IC設(shè)計工具,采用Chiplet和 2.5D/3D-IC 封裝來解決設(shè)計尺寸接近或超過光罩尺寸導(dǎo)致的良率問題。
寫在最后
NVIDIA工程師透露:“不久前,處理一個數(shù)十億門級的設(shè)計,對之進行編譯并創(chuàng)建一個硬件仿真模型,然后將其導(dǎo)入硬件仿真加速器,整個過程需要48-72小時,在采用Cadence Dynamic Duo(Palladium / Protium)后,完成同樣的過程,只需要花費4小時?!?/p>
這是一個典型的例子,而在Cadence完善的EDA和IP解決方案背后,受惠的是整個高性能計算行業(yè)。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。