多核共享資源——解決頻率極限問題的關(guān)鍵
目前,市場(chǎng)上的許多系統(tǒng)在單核處理器上運(yùn)行它們的控制和數(shù)據(jù)層以及附加的服務(wù)。然而,由于存在系統(tǒng)功率預(yù)算問題,單核處理器已經(jīng)逼近了頻率的極限,這個(gè)問題采用晶體管技術(shù)是無法解決的。因此,在下一代系統(tǒng)中對(duì)更高性能和更寬差異化服務(wù)的需求,使這些系統(tǒng)成為多核器件的理想候選人,為系統(tǒng)提供商提高系統(tǒng)的性能提供了一條途徑并增加新的服務(wù),與此同時(shí),保持在常常由系統(tǒng)位置和終端用戶的筆記本驅(qū)動(dòng)的功率預(yù)算之內(nèi)。
這些新型的多核器件在I/O連接性上呈現(xiàn)令人感興趣的挑戰(zhàn)。在許多場(chǎng)合中,隨機(jī)地把特殊的I/O口連接到一個(gè)特殊的核是無法接受的。應(yīng)用劃分可能受到資源跨越多個(gè)核進(jìn)行共享的需求的影響。在接入路由器的應(yīng)用中,許多I/O將接收數(shù)據(jù)包以進(jìn)行處理,正如現(xiàn)存的許多方式一樣,在想把數(shù)據(jù)外發(fā)到一個(gè)公共I/O的眾多核中智能地分布數(shù)據(jù)包。許多現(xiàn)有的解決方案包括在出入口上的一些硬件加速的分解以及分類,從而有助于它們分發(fā)數(shù)據(jù)包,但是,甚至更為簡(jiǎn)單的方法是采用一或多個(gè)核來運(yùn)行代碼,以確定在哪里發(fā)送進(jìn)來的數(shù)據(jù)包。有時(shí)候,當(dāng)一個(gè)核被用作分發(fā)機(jī)制時(shí),軟件在各個(gè)處理器之間可能更具有移植性;但是,該核不僅僅成為了器件的性能瓶頸,也成為了整個(gè)系統(tǒng)的性能瓶頸。如前所述,核頻率將繼續(xù)落后于對(duì)處理能力的要求(這種情形是由日益增長(zhǎng)的快速I/O混合而成的);因此,至關(guān)重要的是確保數(shù)據(jù)包分發(fā)機(jī)制不是瓶頸,并且他們足夠地靈活以確定每一個(gè)數(shù)據(jù)包的最初目的地。
跨越多核對(duì)應(yīng)用進(jìn)行劃分也意味著劃分任何共享資源,如片外存儲(chǔ)器以及片上高速緩沖存儲(chǔ)器。隨著在單一裸片上的核的數(shù)量的增加,片外存儲(chǔ)器帶寬以及片上L2高速緩沖存儲(chǔ)器并沒有在引腳數(shù)以及裸片面積的壓力下而增加。
此外,要考慮的另一個(gè)問題是各個(gè)核采用共享的資源,如硬件加速器(其中包括模式匹配以及加密/解密引擎等等)。這些硬件資源對(duì)于支持較高層的功能是必不可少的,如預(yù)防入侵、虛擬私人網(wǎng)絡(luò)以及當(dāng)今企業(yè)市場(chǎng)需要的、在較高性能級(jí)別上的狀態(tài)防火墻。
一個(gè)良好的例子就是,一個(gè)核要么做它的常規(guī)數(shù)據(jù)包處理,要么利用執(zhí)行單元來完成加速任務(wù)。該核當(dāng)執(zhí)行優(yōu)化指令時(shí)無法轉(zhuǎn)移去處理另一個(gè)數(shù)據(jù)包。數(shù)據(jù)包處理代碼利用Look-Aside加速可以處理一個(gè)數(shù)據(jù)包,把它傳遞給加速器進(jìn)行處理,并開始處理另一個(gè)數(shù)據(jù)包,其行為非常像“管線”方式。在完成任務(wù)以后,加速器把數(shù)據(jù)包返回給內(nèi)核做進(jìn)一步的處理。這種類型的加速容許內(nèi)核完全利用加速器的性能。
評(píng)論