Synopsys ARC處理器家族新增成員,面向更輕型的嵌入式應(yīng)用
9月20日,Synopsys宣布擴(kuò)展其DesignWare?ARC?處理器IP產(chǎn)品組合,推出針對(duì)低功耗嵌入式SoC的新型128位ARC VPX2和256位ARC VPX3 DSP處理器。2019年,該公司推出了用于高性能信號(hào)處理SoC的512位ARC VPX5 DSP處理器。
本文引用地址:http://www.biyoush.com/article/202203/431788.htmSynopsys處理器解決方案高級(jí)營銷總監(jiān)Matt Gutierrez、ARC VPX DSP處理器高級(jí)產(chǎn)品營銷經(jīng)理Markus Willems等介紹了新款ARC處理器。
堅(jiān)定不移地專注于嵌入式應(yīng)用
從1990年代至今,ARC始終專注于支持嵌入式應(yīng)用程序。從歷史上看,ARC處理器并未針對(duì)過移動(dòng)應(yīng)用。但是隨著嵌入式應(yīng)用市場(chǎng)的發(fā)展,ARC處理器技術(shù)也相應(yīng)地發(fā)生了變化。ARC處理器已經(jīng)從僅用于簡(jiǎn)單和專用的任務(wù)(例如電源管理)發(fā)展到甚至可以運(yùn)行64位Linux操作系統(tǒng)。
2010年成為Synopsys的一部分后,蓬勃發(fā)展的物聯(lián)網(wǎng)市場(chǎng)推動(dòng)了構(gòu)建新一代嵌入式ARC處理器。需要一個(gè)非常小的、高效的、低功耗的處理器系列來支持物聯(lián)網(wǎng)市場(chǎng)。一種新的架構(gòu)和ISA誕生了。早期的物聯(lián)網(wǎng)設(shè)備需要最少量的DSP功能,處理器中添加了一些DSP功能就可以支持IoT要求。
快進(jìn)到今天,Synopsys提供五個(gè)不同的ARC產(chǎn)品系列,每個(gè)系列都有廣泛的陣容。嵌入式處理器的每個(gè)產(chǎn)品系列都滿足了廣泛應(yīng)用且嚴(yán)格的要求。VPX2和VPX3DSP主要用于語音處理、雷達(dá)/激光雷達(dá)、傳感器融合和高端物聯(lián)網(wǎng)應(yīng)用。
專注推動(dòng)高效的ARC架構(gòu)
指令集架構(gòu)(ISA)的設(shè)計(jì)考慮了嵌入式市場(chǎng)。例如,比較與控制傳輸和分支與循環(huán)等獨(dú)特的指令可以輕松高效地實(shí)現(xiàn)常見的嵌入式程序行為。另一個(gè)例子是為32位指令執(zhí)行16位編碼。ARC ISA有許多這樣的特性來減少代碼大小,因?yàn)榍度胧皆O(shè)備的內(nèi)存空間非常寶貴。
每個(gè)微架構(gòu)決策也都考慮到嵌入式市場(chǎng)。例如,內(nèi)置影子寄存器對(duì)于實(shí)時(shí)嵌入式應(yīng)用程序非常重要,可以實(shí)現(xiàn)快速上下文切換。這些類型的架構(gòu)決策對(duì)嵌入式應(yīng)用程序有很大的影響??梢暂p松將為某些其他應(yīng)用程序設(shè)計(jì)的處理器進(jìn)行調(diào)整,以支持嵌入式應(yīng)用。
ARC價(jià)值主張的其他重要方面是設(shè)計(jì)的可配置性和指令集的可擴(kuò)展性??膳渲眯允沟脙H實(shí)現(xiàn)SoC所需的最低硬件即可??蓴U(kuò)展性允許添加自定義指令以加速應(yīng)用程序代碼、增加代碼密度并降低功耗。
客戶能夠有效地創(chuàng)建由單一標(biāo)準(zhǔn)MetaWare工具鏈支持的定制處理器硬件,為他們的應(yīng)用程序需求提供最佳PPA和代碼密度。大多數(shù)ARC客戶可以通過為其特定算法添加自定義指令來擴(kuò)展指令集。
應(yīng)對(duì)不斷擴(kuò)大的市場(chǎng)需求
在推出VPX系列處理器之前,ARC處理器可以歸類為大CPU、小DSP IP解決方案。物聯(lián)網(wǎng)傳感器融合、雷達(dá)和LiDAR處理、語音/語音識(shí)別和自然語言處理等嵌入式工作負(fù)載需要成熟的DSP功能。由于Synopsys看到了這種不斷增長的市場(chǎng)需求,
推動(dòng)PPA優(yōu)化信號(hào)處理的關(guān)鍵應(yīng)用
這些市場(chǎng)的產(chǎn)品要求
浮點(diǎn)支持對(duì)于信號(hào)處理應(yīng)用變得越來越重要。為這些市場(chǎng)開發(fā)的數(shù)據(jù)處理算法使用浮點(diǎn)來支持寬動(dòng)態(tài)范圍。保持浮點(diǎn)而不是轉(zhuǎn)換為定點(diǎn)可以更快地將算法映射到設(shè)計(jì)架構(gòu)。支持這些應(yīng)用的DSP庫和線性代數(shù)庫以浮點(diǎn)格式表示。與過去相比,對(duì)矢量浮點(diǎn)運(yùn)算編程的強(qiáng)大支持正變得越來越重要。
人工智能算法的高效執(zhí)行是另一個(gè)必備條件現(xiàn)代DSP。這意味著支持短整數(shù)數(shù)據(jù)類型,如Int8,結(jié)合專用編程環(huán)境,允許圖形平滑映射到DSP架構(gòu)。當(dāng)然,DSP必須配備豐富的機(jī)器學(xué)習(xí)內(nèi)核庫,針對(duì)硬件進(jìn)行優(yōu)化,以簡(jiǎn)化軟件開發(fā)。
用于線性和非線性代數(shù)運(yùn)算的專用硬件加速器顯著加快了這些越來越多使用的數(shù)學(xué)函數(shù)的速度。
隨著產(chǎn)品公司開始提供多種變體,可配置性、可擴(kuò)展性和可縮放性正成為關(guān)鍵要求。每個(gè)變體可以針對(duì)PPA和代碼密度進(jìn)行不同的優(yōu)化。
VPX系列DSP IP
憑借代表7種不同DSP的三種不同VPX系列的可用性,客戶現(xiàn)在可以更靈活地實(shí)現(xiàn)特定應(yīng)用要求。最新的兩款產(chǎn)品基于與兩年前推出的更高性能512位ARC VPX5 DSP處理器相同的VLIW/SIMD架構(gòu)。由于新增產(chǎn)品針對(duì)的是低功耗嵌入式SoC,因此它們?cè)O(shè)計(jì)用于更小的矢量長度,從而實(shí)現(xiàn)更小、更低的功耗。由于超高浮點(diǎn)性能是VPX DSP的重點(diǎn),因此提供了矢量浮點(diǎn)單元(VFPU)作為選項(xiàng)。VFPU由多個(gè)流水線實(shí)現(xiàn),每個(gè)時(shí)鐘周期能夠執(zhí)行多達(dá)512個(gè)FLOP。隨著這兩款新產(chǎn)品的推出,Synopsys還宣布了對(duì)VPX5處理器的一些增強(qiáng)。
ARC VPX2和VPX3 DSP IP
產(chǎn)品的輕松遷移和可擴(kuò)展性
Synopsys ARC MetaWare開發(fā)工具包支持ARC VPX處理器,該工具包提供矢量長度不可知(VLA)軟件編程模型。從編程的角度來看,向量長度被標(biāo)識(shí)為“n”,n的值在定義語句中指定。MetaWare編譯器執(zhí)行映射并選擇正確的軟件庫集進(jìn)行編譯。編譯器還提供自動(dòng)矢量化功能,可將順序代碼轉(zhuǎn)換為矢量操作,以實(shí)現(xiàn)最大吞吐量。
結(jié)合DSP、機(jī)器學(xué)習(xí)和線性代數(shù)函數(shù)軟件庫,MetaWare開發(fā)工具包提供了一個(gè)全面的編程環(huán)境。
總之,上述功能使客戶能夠輕松地在VPX系列的所有成員之間遷移和/或擴(kuò)展他們的產(chǎn)品。
優(yōu)化當(dāng)前基于ARC VPX5的設(shè)計(jì)的機(jī)會(huì)
可擴(kuò)展的ARC VPX系列一覽
VPX5增強(qiáng)功能包括雙寬矢量加載/存儲(chǔ)、更寬的AXI接口、ISA擴(kuò)展以及支持基于VLA的編程模型的機(jī)器學(xué)習(xí)、DSP和線性代數(shù)庫。這些增強(qiáng)功能使VPX5在常見DSP功能(如FFT、點(diǎn)積和窗口化)方面的性能與早期版本相比提高了一倍。在許多應(yīng)用中,設(shè)計(jì)人員無需為這些功能實(shí)現(xiàn)設(shè)計(jì)單獨(dú)的外部加速器。
對(duì)于汽車市場(chǎng)
為了滿足汽車市場(chǎng)更高的安全要求,Synopsys為其整個(gè)產(chǎn)品組合提供了功能安全(FS)系列,包括VPX系列處理器。FS系列處理器滿足隨機(jī)故障檢測(cè)和系統(tǒng)功能安全開發(fā)流程要求,完全符合ISO 26262至ASIL D。
概括
提供設(shè)計(jì)效率、優(yōu)化PPA和最大化軟件代碼密度是ARC的根本所在。Synopsys的ARC VPX DSP系列處理器為客戶提供全方位的可擴(kuò)展解決方案,以滿足他們不同的需求。
評(píng)論