TI KeyStone 架構(gòu)支持 L2 與傳輸處理
借助多內(nèi)核導航器,系統(tǒng)中的所有數(shù)據(jù)包都能夠滿足數(shù)據(jù)包DMA 接口規(guī)范要求。數(shù)據(jù)包通常以圖 8 中的主機類型數(shù)據(jù)包格式表示,其可實現(xiàn)靈活的存儲器使用模式。在這種格式下,數(shù)據(jù)包通過鏈路緩沖器描述符 (BD) 來表述。我們將第一個 BD被稱為數(shù)據(jù)包描述符 (PD)。BD 具有指向儲存數(shù)據(jù)包有效負載的數(shù)據(jù)包緩沖器指針。隊列管理器可與 PD 協(xié)同工作。
圖 8 –主機類型的數(shù)據(jù)包格式
9
隊列管理器可在其內(nèi)部隨機訪問存儲器 (RAM) 中維護數(shù)據(jù)包鏈路信息,從而為實現(xiàn)超高效率的數(shù)據(jù)包壓入與彈出提供簡單的軟件應用編程接口 (API)。此外,其還可以確保隊列所有訪問的多核原子性,從而將多核軟件從門控與保護邏輯中釋放出來。為了實現(xiàn)基于演進數(shù)據(jù)包系統(tǒng) (EPS) QoS 的無線電廣播承載服務架構(gòu)目標,相似服務等級的無線電廣播承載都要以硬件隊列集的形式出現(xiàn)。
零復制 RLC/MAC 概念充分利用數(shù)據(jù)有效負載無需在 PHY 編碼器/解碼器的 PDCP 加密(解密)與 CRC 生成(或校驗)之間進行處理的這一原理。RLC 與 MAC 子層需要對數(shù)據(jù)包進行匯聚/解匯聚、分段/解分段、多路復用/解多路復用,并需添加/移除控制信息與報頭。想要在無需觸及有效負載數(shù)據(jù)(零復制)的情況下實現(xiàn)這一點可節(jié)約多達 90-95% 的處理周期時間。因此,有效負載數(shù)據(jù)駐留在 DDR 中,而且 L2 DSP 核心軟件是不可觸及的。
圖 9 – 下行數(shù)據(jù)流示例
10
例如,在下行方向,網(wǎng)絡協(xié)處理器數(shù)據(jù)包 DMA 進程負責對數(shù)據(jù)包進行接收、分段與分配。RLC/MAC 軟件可在數(shù)據(jù)包描述符上運行且無需訪問數(shù)據(jù)包有效負載。其構(gòu)建的 MAC PDU 可被 SRIO 數(shù)據(jù)包 DMA 發(fā)出并反向重組成相鄰的存儲器。
RLC/MAC 軟件使用數(shù)據(jù)包 API 庫在數(shù)據(jù)包內(nèi)運行。該軟件可在數(shù)據(jù)包鏈中移除/插入描述符,而且還能執(zhí)行數(shù)據(jù)包合并/分離操作。在需要額外報頭時才用得上新的描述符。圖 9 以在網(wǎng)絡協(xié)處理器中執(zhí)行 PDCP (RoHC) 等所有快速通道處理為假定條件,對下行數(shù)據(jù)流進行了總結(jié)。
我們將所有指向預分配固定容量數(shù)據(jù)緩沖器的 BD 鏈接在一起,并將其放置在下行 (DL) 自由隊列中。有多個自由隊列,每一個隊列都對應一個固定容量的緩沖器。當來自網(wǎng)絡協(xié)處理器的數(shù)據(jù)包到達后,網(wǎng)絡協(xié)處理器中的數(shù)據(jù)包 DMA 即從 DL 自由隊列中拉取 BD,然后根據(jù) GTP-U ID/RBQ ID 映射對其進行初始化和構(gòu)建 PD,并將 PD 壓入 RBQ。DL 調(diào)度程序制定分配決策,并向 RLC/MAC 進程發(fā)布分配授權(quán)。
RLC 與 MAC 根據(jù)需要彈出授權(quán)的 RBQ,然后將 PD 路由至 RLC 與MAC 隊列??赡軐?shù)據(jù)包分段,之后統(tǒng)一進行多路復用并為其添加報頭。數(shù)據(jù)包被保留在 RLC AM 重傳隊列中,同時對這些數(shù)據(jù)包克隆的復制版本(新的 PD 指向同一緩沖器)會向下流至可創(chuàng)建 MAC PDU 的協(xié)議棧。當傳輸就緒時,數(shù)據(jù)包(用于已分配 UE 的 MAC PDU)在硬件 DL PHY 隊列中排隊。SRIO 中的數(shù)據(jù)包 DMA 從 DL PHY 隊列獲取數(shù)據(jù)包,然后將它們傳輸至 LTE PHY 設(shè)備。傳輸開始后,數(shù)據(jù)包進入 HARQ 重傳隊列,并且在成功交付后返回到 DL 自由隊列中。
調(diào)度層對于調(diào)度層,制定無線電廣播資源的分配時需將瞬時通道條件、流量條件以及 QoS 等要求納入考慮范圍。因為通道與流量條件因時間和頻率的不同會有很大差異,因此能否實現(xiàn)高效的帶寬利用率很大程度上取決于調(diào)度程序選擇最佳可能用戶(單個用戶或用戶對)的能力。
典型的調(diào)度算法可為單個或多個用戶模式構(gòu)建一組調(diào)度假定方案。調(diào)度程序然后根據(jù)鏈路的自適應性為每種假定計算中標率。最終,調(diào)度程序選出最佳假定方案并用以指導通道分配。
調(diào)度算法的復雜性是由單個調(diào)度假定的計算成本以及需檢查的假定數(shù)目來決定的。信號處理密度型調(diào)度是一種高效率的動態(tài)的通道感知型調(diào)度。上行端的 FDD/TDD 調(diào)度程序需要計算足夠大的一套假定方案才能維持單個或多個用戶模式的調(diào)度增益;同時,帶下行鏈路波束成形 (downlink beam foaming) 的 TDD 調(diào)度程序要求的假定方案可假定定向傳輸與特征值分解 (EVD) 計算。KeyStone 架構(gòu)中的 C66x DSP 內(nèi)核可支持專業(yè)的定點與浮點指令,可實現(xiàn)高效的 EVD 計算,如矩陣相乘、矩陣求逆以及大量用戶(數(shù)以百計甚至數(shù)以千計)的高效搜索與篩選。圖 10 提供了由 TI 仿真工具生成的調(diào)度程序可視化示例。此例使用 100 個無線電廣播資源模塊,每個傳輸時間間隔(TTI,1 毫秒)可生成 20 個分配授權(quán)。頻譜的較低位部分可用于半持續(xù)性語音流量,而較高位部分則用于特定的數(shù)據(jù)流量。
圖 10 – 調(diào)度程序可視化示例
結(jié)論TI KeyStone 多內(nèi)核 SoC 架構(gòu)可提供一個低時延、高吞吐量的低成本高效率平臺,可支持適用于宏與小型蜂窩 eNodeB 系統(tǒng)的真正多標準 (LTE、WCDMA)解決方案。高吞吐量硬件加速器與數(shù)據(jù)包基礎(chǔ)局端加速可實現(xiàn)靈活且可擴展的 LTE 部署,同時還能最大限度地縮短 LTE 系統(tǒng)所需的時延。在同一 DSP 中集成定點與浮點技術(shù)可實現(xiàn)優(yōu)化的矩陣處理最,以滿足 LTE要求的調(diào)度效率。
根據(jù)對宏 LTE 系統(tǒng)的解決方案分析,由于采用KeyStone 多內(nèi)核架構(gòu)實現(xiàn)快速通道與零復制處理,可以將 20 MHz、2x2 多重輸入多重輸出 (MIMO) 以及 105 Mbps 下行與 52Mbps 上行數(shù)據(jù)率- L2 數(shù)據(jù)-以及傳輸層系統(tǒng)開銷降低10 到 15 倍。借助針對 LTE 調(diào)度程序運行而優(yōu)化的 C66x DSP 定點與浮點指令,還可以使用更多高級調(diào)度算法,從而將頻譜利用率提高 20%。
評論