嵌入式系統(tǒng)的高可用性
設計人員正在調整各種高可用體系結構,以滿足客戶對用于下一代超級可靠嵌入式系統(tǒng)應用的持久數據接口的需求。
本文引用地址:http://www.biyoush.com/article/151218.htm要點
高速串行數據鏈路和交換結構技術實現動態(tài)路徑,人們能圍繞不可操作的子系統(tǒng)重新設定信息路由。
管理軟件自動監(jiān)視系統(tǒng)工作,并在發(fā)生故障或性能降低時用冗余元件來替換。
熱插拔特性實現無中斷的修理和升級,并為發(fā)展容錯自愈系統(tǒng)鋪平了道路。
刀片計算機集群以更低的采購和運營成本支持可擴展、高密度、高可用的服務器系統(tǒng)。
隨著普適計算時代的到來(屆時用戶將可隨時隨地訪問信息和服務),嵌入式系統(tǒng)設計人員在提高服務器、遠程設備、數據傳輸基礎設施的可用性方面承受著日益增大的壓力。鑒于其應用,人們對嵌入式系統(tǒng)可靠性的期望遠遠高于對多數其它計算系統(tǒng)的期望。終止或重啟其中一些關鍵應用系統(tǒng)需要承擔人身財產或重要信息損失的風險。在滿足這些要求的過程中,嵌入式系統(tǒng)設計者運用各種智能硬件和軟件冗余技巧在日常運行中實現高達99.999%的可用性,即每年停機時間不到六分鐘。
“高可用性”描述系統(tǒng)特性,它們使系統(tǒng)在發(fā)生硬件或軟件故障時能夠保持連續(xù)工作。高可用系統(tǒng)具有內置監(jiān)視和復制數據路徑,透明地取代可選硬件或軟件組件復制正常功能,在出現故障時也能照常工作。一般而言,高可用性系統(tǒng)還支持在不中斷運行的前提下替換故障組件或升級。隨著通用連接的問世,數據安全也成了可用性的一個要素,這是因為未授權的黑客、惡意軟件或外部“拒絕服務”攻擊會導致預期功能中斷??捎眯砸话愣x為MTBF/(MTBF+MTTR),其中MTBF是指平均無故障時間,MTTR是指平均修理時間。
高可用性對于越來越多的嵌入式系統(tǒng)應用都變得十分必要,而不斷提高的技術趨勢使系統(tǒng)設計任務日益困難。例如,可以預見,隨著客戶需要嵌入式設備中有更多功能,增加的硬件和軟件組件帶來了新的故障模式。顯然,增加的的組件不利于達到更高的可用性,甚至產生其它冗余性,從而不斷加劇系統(tǒng)復雜性。當前向普遍連接發(fā)展的趨勢也給高可用嵌入式系統(tǒng)設計者帶來了許多數據安全與通信可靠性問題。雖然最可靠的系統(tǒng)可能使用有限資源的簡便的單獨設備,但設計者必須采用一種提高任意嵌入配置可用性的戰(zhàn)略。
不間斷運行
當前多數用于提高服務可用性的訣竅和技巧均源自電信行業(yè)。多年來,電信設備制造商設計了多種方案,以便提供不間斷的服務,即使發(fā)生硬件和軟件故障也是如此。遺憾的是,多數方案都是專有的,維護費用高,并且難以在要求演變時進行更新。它們還需要很長的開發(fā)周期。設備設計者無法利用COTS(商用現貨)構件,這是因為沒有通用內置設備提高服務可用性。為了解決可用性難題,電路板制造商制定一系列可與專有系統(tǒng)性能匹敵的硬件和軟件規(guī)范。
IPMI(智能平臺管理接口)規(guī)范是用來解決可用性問題的最早標準之一,它由戴爾、英特爾、惠普、NEC公司制定,旨在從本地和遠程監(jiān)視設備,以便執(zhí)行電源管理、冷卻、電子鍵控和熱插拔等事務處理。IPMI與管理控制器相互配合,后者在主機處理器出現故障時可依靠自身運行。借助平臺管理,操作人員能監(jiān)視設備是否出現邊際操作或潛在問題,并能在它們變成系統(tǒng)故障之前糾正它們。PICMG(PeripheralComponentInterconnectIndustrialComputerManufacturersGroup)組織把IPMI的若干變體都包含到電路板級CompactPCI規(guī)范和ATCA(高級電信計算架構)規(guī)范中。
為了最大限度發(fā)揮IPMI的優(yōu)勢,設備客戶需要具備熱插拔功能,以便在不關閉系統(tǒng)的情況下替換出故障的系統(tǒng)板。熱插拔系統(tǒng)要求硬件和軟件能夠在等待修理的同時,動態(tài)設定信號路由,使其繞過出故障的組件。必備熱插拔技術之一是系統(tǒng)板和背板之間的物理連接。如果不控制電源涌流和背板信號連接,簡單直連可能會干擾總線上的其它板。例如,CompactPCI利用不同長度的分級引腳來控制通向背板的物理連接。卡片導向器確保板的插入垂直于背板。較長的引腳首先對接、供電并接地,以便對PCI總線信號預充電。串聯(lián)電阻限制了電源電流浪涌。中等長度引腳連至處于預充電、高阻抗或禁用狀態(tài)的PCI總線信號。最短的引腳支持總線通信。
防故障交換結構
串行交換結構技術是另一種設計創(chuàng)新,對于高可用性系統(tǒng)有多種好處。這些體系結構允許在計算節(jié)點之間設立動態(tài)數據路徑,并支持多路并發(fā)數據傳輸。交換結構的一個主要好處是,每條連接均為直接的點到點數據路徑,并帶來更好的電特性,允許的頻率和帶寬高于總線體系結構。典型的交換結構使用多級開關在源和目標之間建立路由。這些動態(tài)路徑對于高可用性設計也很有價值,使人們能圍繞不可操作的子系統(tǒng)設定數據路由。多數主要電路板標準現在都規(guī)定交換結構,盡管它們并未提出具體的交換結構技術實現數據傳輸。與此相反,一系列附屬規(guī)范為以太網、InfiniBand、StaRFabric、PCIExpress、RapidIO等各種交換結構對背板進行詳細定義。雖然這種方法滿足了業(yè)內不同觀點的要求,但它也可能造成同一標準內部的互操作問題。
VITA(VMEbus International Trade Association)41 VXS 為廣泛應用的 VMEbus (Versa-module eurocard bus)增添了一些交換結構技術高可用性優(yōu)勢。VXS 規(guī)范定義了一種有效載荷卡、一種交換卡、一種新型高帶寬背板連接器,并保留標準的并行 VMEbus 連接器。每個新型交換結構端口均包含兩組四聯(lián)串行位通道——一組用于輸入數據,另一組用于輸出數據,對于每條串行通道均支持 10 Gbps 數據速率。交換卡包含必要的結構交換功能,以便在有效負荷卡之間或圍繞故障設定串行數據路由,或使其繞過故障。為了保持交換結構任意性,VITA 41子規(guī)范為 InfiniBand、串行RapidIO、GbE(千兆以太網)、PCI Express 定義了交換卡和有效載荷卡。
PICMG(PCI Industrial Computer Manufacturers Group)針對電信設備的獨特要求,發(fā)布了 ATCA 規(guī)范,提供 VME 和 CompactPCI 等開放體系結構的替代結構。ATCA 重點強調高可用性特性,采用高速串行數據鏈路和交換結構技術。超大板面積支持復雜的電信電路,并提供輸入電源和冷卻功能,實現每插槽高達 200 W 的功率。ATCA 規(guī)范具有適用于所有板和有源模塊的熱插拔功能,因此最大限度減少系統(tǒng)中斷。一個機架管理元件(其規(guī)范基于IPMI)監(jiān)視各插入模塊的健康、功率、冷卻甚至鍵控情況,以確保各子系統(tǒng)在高效率工作。各模塊從冗余-48V直流饋電器獲得電力,并從冗余控制與數據板獲取數據,以防止單一故障使整個機箱停止運行。
評論