泰克科技 | PCIe 6.0 互操作性PHY驗(yàn)證測(cè)試方案
由于CPU、GPU、加速器和交換機(jī)的創(chuàng)新,超大規(guī)模數(shù)據(jù)中心的接口需要更快的數(shù)據(jù)傳輸,不僅在計(jì)算和內(nèi)存之間,還涉及網(wǎng)絡(luò)。PCI Express (PCIe?) 成為這些互連的基礎(chǔ),支持構(gòu)建 CXL?和 UCIe?等協(xié)議。CXL提供緩存一致性互連,支持多臺(tái)機(jī)器間的內(nèi)存擴(kuò)展,提供最低延遲和最高帶寬。CXL和NVM Express?利用 PCIe 的物理層和簡(jiǎn)便的協(xié)議適應(yīng)性。UCIe作為最新的Chiplet標(biāo)準(zhǔn),也基于PCIe,支持可靠的數(shù)據(jù)傳輸和CXL緩存一致性。因此,PCIe 憑借其高速、低延遲和低功耗,成為處理節(jié)點(diǎn)之間數(shù)據(jù)傳輸?shù)臉?biāo)準(zhǔn)。
本文討論了對(duì)PCI Express 6.0和未來(lái)標(biāo)準(zhǔn)的行業(yè)需求,合規(guī)性的重要性,如何通過(guò) PHY 驗(yàn)證成功實(shí)現(xiàn)互操作性,以及針對(duì)PCIe 6.0收發(fā)器的測(cè)量方法。Synopsys的PCI Express 6.0 IP和Tektronix的測(cè)試與測(cè)量解決方案正積極應(yīng)對(duì)這一最新的技術(shù)轉(zhuǎn)折點(diǎn)。
數(shù)據(jù)速率再次翻倍
PCI-SIG? 聯(lián)盟是一個(gè)由900多家成員公司組成的開(kāi)放行業(yè)標(biāo)準(zhǔn)組織,每三年發(fā)布一個(gè)新的PCIe版本。過(guò)去十年中,數(shù)據(jù)速率定期翻倍并保持完全向后兼容。PCIe 6.0.1引入 PAM4信號(hào)技術(shù),實(shí)現(xiàn)單通道64 GT/s傳輸速率,x16鏈路雙向傳輸達(dá)到256GB/s。2022年,PCI-SIG宣布了PCIe 7.0規(guī)范,將數(shù)據(jù)速率提升至128GT/s,并使用1b/1b flit編碼和PAM4信號(hào)技術(shù),在16通道下實(shí)現(xiàn)512GB/s雙向吞吐量,同時(shí)提高電源效率。除了超大規(guī)模數(shù)據(jù)中心,PCIe技術(shù)也被廣泛應(yīng)用于手持設(shè)備、服務(wù)器、汽車等領(lǐng)域,這些市場(chǎng)對(duì)可靠性和成本有嚴(yán)格要求,確保產(chǎn)品符合PCIe 6.0.1規(guī)范并實(shí)現(xiàn)互操作性是關(guān)鍵。
圖1:PCI-SIG各代帶寬
合理性和互操性測(cè)試
PCI-SIG的合規(guī)性和互操作性測(cè)試對(duì)于PCIe 6.0.1集成商至關(guān)重要。設(shè)計(jì)驗(yàn)證、PHY驗(yàn)證和合規(guī)性測(cè)試共同降低集成風(fēng)險(xiǎn)并提升產(chǎn)品質(zhì)量。PCIe系統(tǒng)有多種拓?fù)洌w服務(wù)器、存儲(chǔ)、GPU托架等,所有配置需滿足16GHz奈奎斯特頻率下的32dB插入損耗預(yù)算。具體分配為Root Complex 23.5dB,Add-in card 8.5dB,其中包括PCB走線損耗和連接器預(yù)算。因主設(shè)備與最終設(shè)備間距離最小,主板可能需更高質(zhì)量的 PCB 材料和 Retimer。PCIe向后兼容性及速率升級(jí)(如64GT/s和128GT/s)增加了通道設(shè)計(jì)復(fù)雜性。
溫濕度影響可致插入損耗變化,先進(jìn)PCB材料變化約±10%,主流材料約±25%。開(kāi)發(fā)需考慮PHY對(duì)阻抗不連續(xù)性和PVT(工藝、電壓、溫度)變化的補(bǔ)償能力,通道均衡技術(shù)需適應(yīng)并持續(xù)調(diào)整以應(yīng)對(duì)環(huán)境變化,確保操作裕度。因此,與生態(tài)系統(tǒng)的廣泛互操作性驗(yàn)證對(duì)確保PHY穩(wěn)健性至關(guān)重要。
用于PAM4信號(hào)的新測(cè)量方法
PCI Express 6.0.1基礎(chǔ)規(guī)范將PHY層劃分為邏輯子模塊和電氣子模塊(如圖2所示)。電氣子模塊的驗(yàn)證是 PHY 層全面驗(yàn)證的前提條件,這也是本文的重點(diǎn)。電氣子模塊包括發(fā)射器(Tx)、接收器(Rx)、參考時(shí)鐘(Refclk)和通道要求。支持新的64GT/s數(shù)據(jù)速率的收發(fā)器(Tx 和 Rx)還必須保持與較低速率(2.5、5.0、8.0、16.0和32.0GT/s)的向后兼容性。在6.0.1中引入的脈沖幅度調(diào)制方法(PAM4)要求有四個(gè)不同的信號(hào)級(jí)別,這允許在一個(gè)單位間隔(UI)內(nèi)傳輸兩位信息。從NRZ(兩個(gè)信號(hào)級(jí)別)到PAM4的轉(zhuǎn)換確保了通道損耗與PCIe 5.0(32GT/s)保持一致,因?yàn)檫@兩種速率的波特率都是32Gb/s,奈奎斯特頻率也為16GHz。
圖2:PCI Express模塊圖
由于信號(hào)方案從NRZ變?yōu)镻AM4,垂直眼圖的開(kāi)口減少了33%,因?yàn)槲覀儚?個(gè)信號(hào)級(jí)別增加到4個(gè)信號(hào)級(jí)別。現(xiàn)在需要考慮3個(gè)眼圖,而不是單個(gè)NRZ眼圖。這種噪聲裕度的減少加劇了串?dāng)_干擾、信號(hào)反射和電源噪聲。為緩解增加的噪聲敏感性,PCIe 6.0.1還采用了格雷編碼以最小化比特錯(cuò)誤,并采用預(yù)編碼來(lái)減少突發(fā)錯(cuò)誤傳播。基于DAC和ADC/DSP的Tx和Rx均衡技術(shù)可以用于校正可補(bǔ)償?shù)膿p傷,如符號(hào)間干擾(ISI),其中相鄰比特由于通道影響(包括損耗和反射)而變得模糊不清。PCIe 6.0.1規(guī)范引入了信噪失真比(SNDR)來(lái)幫助量化這一新的設(shè)計(jì)挑戰(zhàn)。
圖3:信噪失真比 (SNDR)
SNDR建立在長(zhǎng)期以來(lái)使用的信噪比 (SNR) 測(cè)量基礎(chǔ)之上,但引入了一個(gè)名為“σe”的變量,用于捕捉電信號(hào)中的不可補(bǔ)償損傷。為了簡(jiǎn)化設(shè)計(jì)和直觀理解,我們大量依賴線性模型,這些模型只是對(duì)物理世界的近似。非線性行為確實(shí)存在于PCIe收發(fā)器和通信通道中。標(biāo)準(zhǔn)通過(guò)引入SNDR的“σe”項(xiàng)來(lái)捕捉這種影響。這一技術(shù)借用了IEEE標(biāo)準(zhǔn)的方法,并針對(duì)64GT/s的PCIe測(cè)量進(jìn)行了定制。脈沖響應(yīng)是從 PRBS(偽隨機(jī)二進(jìn)制序列)數(shù)據(jù)模式波形創(chuàng)建的,使用 IEEE 的線性擬合脈沖響應(yīng)方法,這成為確定信號(hào)幅度和“σe”的核心。準(zhǔn)確的SNDR測(cè)量需要50GHz帶寬的實(shí)時(shí)示波器來(lái)捕捉信號(hào),并使用DSP軟件進(jìn)行波形后處理(如圖3所示)。
PAM4信號(hào)中一種預(yù)期的非線性情況發(fā)生在發(fā)射信號(hào)電平不均勻間隔時(shí)。假設(shè)靜態(tài)幅度,這將影響三個(gè)眼圖中的一個(gè)或多個(gè),導(dǎo)致比特錯(cuò)誤增加。在后硅驗(yàn)證過(guò)程中對(duì)這種現(xiàn)象進(jìn)行表征可以使收發(fā)器調(diào)整或設(shè)計(jì)更改以提高電平的線性度。為了解決這個(gè)問(wèn)題,PCIe標(biāo)準(zhǔn)首次引入了電平失配比(RLM),以更好地理解和改進(jìn)PAM4發(fā)射器的性能。這一基礎(chǔ)規(guī)范測(cè)量預(yù)計(jì)將在包括CEM形態(tài)的系統(tǒng)級(jí)驗(yàn)證中擴(kuò)展,CEM常用于顯卡和網(wǎng)絡(luò)接口卡 (NIC) 的實(shí)現(xiàn)。
圖4:受損眼校準(zhǔn)
從電壓到時(shí)序相關(guān)挑戰(zhàn)的過(guò)渡對(duì)在最新PCIe 6.0.1數(shù)據(jù)速率下實(shí)現(xiàn)穩(wěn)定鏈路具有重要意義。當(dāng)信號(hào)從相鄰級(jí)別(例如,從電平1到電平2)過(guò)渡時(shí)的名義斜率將小于從電平0到電平3的過(guò)渡,導(dǎo)致更多的垂直噪聲被轉(zhuǎn)移到時(shí)序抖動(dòng)中。此外,由于可能的電平過(guò)渡數(shù)量的增加,眼圖寬度固有地減小。高級(jí)測(cè)量?jī)x器(例如實(shí)時(shí)示波器)的噪聲表征和補(bǔ)償技術(shù)首次被PCIe標(biāo)準(zhǔn)納入考慮,以減輕與測(cè)量相關(guān)的噪聲,并提高電壓和時(shí)序測(cè)量(例如非相關(guān)抖動(dòng))的準(zhǔn)確性。
為PCIe 4.0和5.0接收器建立的測(cè)量方法隨著PCIe 6.0.1的Rx校準(zhǔn)和測(cè)試得到了擴(kuò)展。最差“壓力眼” 信號(hào)是使用允許的最高通道損耗創(chuàng)建的,并傳遞到被測(cè) Rx,以量化其性能。Rx 將數(shù)字化模擬信號(hào),然后使用回環(huán)模式從相應(yīng)的 Tx 重新發(fā)送比特流,以逐位比較來(lái)確定比特錯(cuò)誤率 (BER) 或測(cè)量不同正弦抖動(dòng) (Sj) 頻率的抖動(dòng)容限 (JTOL)。在64GT/s下運(yùn)行的接收器需要能夠跟蹤低于10MHz的抖動(dòng)增加量和高頻率下0.05 UI的抖動(dòng)量。具有獨(dú)立時(shí)鐘的上下行端口時(shí)鐘架構(gòu)需要增加對(duì)33 kHz擴(kuò)展頻譜時(shí)鐘 (SSC) 的容忍度。
壓力眼信號(hào)的校準(zhǔn)是物理層驗(yàn)證的復(fù)雜方面,涉及比特誤差率測(cè)試儀 (BERT)、物理通道、實(shí)時(shí)示波器 (scope) 和多個(gè)DSP軟件包。最終,這是對(duì)充當(dāng)PCIe Tx的BERT脈沖模式發(fā)生器 (PPG) 的校準(zhǔn)。圖4顯示了這個(gè)校準(zhǔn)過(guò)程。目標(biāo)是建立一個(gè)嵌入到基礎(chǔ)規(guī)范中定義的行為接收器鎖存器的眼圖,其中包括時(shí)鐘數(shù)據(jù)恢復(fù)器 (CDR) 和行為接收器均衡器。通過(guò)調(diào)整通道損耗、噪聲和抖動(dòng)來(lái)實(shí)現(xiàn)目標(biāo)眼圖,允許的頂部眼高度和眼寬度范圍被找到。通道調(diào)整帶來(lái)的符號(hào)間干擾 (ISI) 對(duì)眼圖提供了最大的調(diào)整,而正弦抖動(dòng) (Sj) 和使用差模干擾的串?dāng)_作為微調(diào)機(jī)制。業(yè)界越來(lái)越依賴軟件自動(dòng)化來(lái)理解和實(shí)現(xiàn)接收器測(cè)試的壓力眼校準(zhǔn)。
圖5:使用Tektronix解決方案進(jìn)行Synopsys PCI Express 6.0 PHY 驗(yàn)證
PCIe 6.0 解決方案
互操作性仍然是PCIe技術(shù)成功的支柱,推動(dòng)了新興技術(shù)(如 CXL)的廣泛普及和采用,并被納入未來(lái)的Chiplet(die-to-die)設(shè)計(jì)中,例如 UCIe。實(shí)現(xiàn)互操作性始于IP設(shè)計(jì)或選擇,并涉及在基礎(chǔ)規(guī)范和系統(tǒng)級(jí)別的測(cè)試,以確保來(lái)自不同供應(yīng)商的設(shè)備能夠正確建立鏈路并在不同的工作電壓和溫度下保持穩(wěn)定。還必須考慮可制造性產(chǎn)品的可實(shí)現(xiàn)良率。例如,為了驗(yàn)證Synopsys的PCI Express 6.0 IP,本文所述的測(cè)試設(shè)置包括Tektronix的DPS77004SX示波器、Tektronix 的測(cè)試自動(dòng)化軟件以及Anritsu MP1900A BERT(如圖5所示)。
Synopsys提供了涵蓋該標(biāo)準(zhǔn)所有代數(shù)的完整PCI Express控制器、PHY和驗(yàn)證IP解決方案,這些解決方案已在客戶產(chǎn)品中得到硅驗(yàn)證,目標(biāo)應(yīng)用包括重定時(shí)器、閃存控制器、加速器、SSD U.2/U.3、PCIe交換機(jī)和智能NIC。Synopsys IP已實(shí)現(xiàn)多次成功的第三方互操作性。Tektronix提供了一個(gè)完整的PCI Express 6.0基礎(chǔ)Tx/Rx自動(dòng)化解決方案,并向下兼容較低的數(shù)據(jù)速率和特定外形的測(cè)試。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。