ASON網(wǎng)絡的運維和管理
傳統(tǒng)傳輸網(wǎng)絡的運維和管理
網(wǎng)絡的運維和管理主要包括以下工作:電路調度、告警分析、故障管理、性能分析、資源管理、數(shù)據(jù)處理、網(wǎng)絡優(yōu)化等。在以分層方式實現(xiàn)運維和管理的傳輸網(wǎng)絡中,這些工作大多都是靠工作人員來完成的。
網(wǎng)管人員進行電路調度時,在知道所需的電路的源和目的地址以及所需帶寬的情況下,需要查看網(wǎng)絡的可達路由中哪些是空閑的,然后依據(jù)流量均衡、最少跳數(shù),最小代價或者其它約束條件從這些空閑的路由中選擇一條路由進行配置。具體配置過程中,還要依據(jù)所需帶寬,選擇合適的時隙沿路由對經(jīng)過的節(jié)點進行交叉連接配置。如果在一個環(huán)中無法配置所需電路時,則需要跨環(huán)進行配置,這樣路由的選擇和交叉連接的配置就更為復雜,需要的時間也更長。如從北京到上海需要配置一條2M的電路,查找到的路由為北京-武漢-上海,而該電路需要在兩纖雙向復用段保護環(huán)中(速率為10G)配置,為了說明配置過程,我們以武漢節(jié)點為例來說明,為配置該電路,必須指定2M的入時隙和出時隙,而確定入/出的2M時隙必須了解該2M在所屬155M中的位置(155M中包括63個2M),還必須指定該155M在10G中的位置(10G包括64個155M),這樣,指定了2M在入/出節(jié)點中第幾個155M的第幾時隙就可以進行交叉連接配置。由此可見,當電路經(jīng)過的節(jié)點數(shù)比較多時,配置是非常復雜和耗時的,而且也不利于統(tǒng)一規(guī)劃和網(wǎng)絡的優(yōu)化。
告警分析和故障的管理,在傳統(tǒng)的傳輸網(wǎng)絡的告警分析中,主要依賴廠家網(wǎng)管系統(tǒng)中提供的簡單的告警處理,而故障的定位和管理根本就沒有。這在純SDH系統(tǒng)中,問題還不是太大,但在SDH+WDM系統(tǒng)中,由于底層故障不僅反映到自身系統(tǒng)中,還反映到上層多個相關聯(lián)的系統(tǒng)中,沒有故障定位就會導致多層保護倒換無法協(xié)調,而且給故障的人工處理也帶來一定的難度??傊?,告警分析簡單、缺乏故障處理能力給網(wǎng)絡管理和運維帶來的問題比較大,因為故障情況下,受影響的業(yè)務都需要得到實時或者準實時的解決,這就需要故障的快速定位和處理。這也是大多數(shù)運營商非常關注故障定位的原因。
網(wǎng)絡優(yōu)化和資源管理:網(wǎng)絡的優(yōu)化一般是在兩種情況下進行的,一是資源分配不合理或者不夠用;二是提高網(wǎng)絡的其它指針(如運維考核指針、網(wǎng)絡安全性指針等)。傳統(tǒng)的傳輸網(wǎng)絡為環(huán)形網(wǎng)絡,所以如果在一個環(huán)中配置路由時,可選擇的路由只有兩條,一般情況下,選擇的路由都是跳數(shù)最少的路由,這樣可以節(jié)約板卡資源。而由于業(yè)務發(fā)展的不均衡性,這樣選路的結果就會導致環(huán)網(wǎng)中局部資源利用率過高,而其它部分利用率過低的現(xiàn)象,這種現(xiàn)象在節(jié)點數(shù)較多的環(huán)形網(wǎng)絡中更為常見,所以為了優(yōu)化網(wǎng)絡使用的資源,需要調整電路,使資源得以合理利用??上攵@在業(yè)務已經(jīng)配置好,而且調度需要完全手動的情況下是多么復雜,而且在線業(yè)務的手動重新配置的風險也比較大,由此導致的結果就是僅僅進行局部的優(yōu)化,而是不斷的升級擴容或者大環(huán)拆小環(huán)的工作。此外,運行維護的指針有時候和資源優(yōu)化的目標是相互矛盾的,安全性指針是網(wǎng)絡中最重要的指針,而為了保證某些重要電路的安全性,使其具有抗雙點故障的性能,或者避免出現(xiàn)雙點故障情況下出現(xiàn)某些局向全阻的現(xiàn)象,某兩點之間的電路(某個局向的電路)就應該分配到不相關的,而且不在同一個環(huán)上的兩條或者多條路由上,因為不在同一個環(huán)上的兩條路由,必定有一條不是最優(yōu)的,而且有可能代價很大,這樣勢必造成網(wǎng)絡資源的浪費,所以這種調整往往是在出現(xiàn)故障已經(jīng)影響到重要的業(yè)務,或者是在預測到單個環(huán)上故障概率很高的時候的一種預防措施,譬如說颶風、洪水等自然災害的影響。
性能分析和數(shù)據(jù)處理:這是日常維護和管理工作不可缺少的一部分,從大量的表格中取出有用的資料來進行分析和處理,然后分析出電路利用率、信道組織圖,故障概率表,資源利用率等,按星期、按月和按季都要出這樣的分析報表,此外,為了分析的方便,還經(jīng)常需要當年和往年同期比較的資料分析,在傳統(tǒng)的運維中,這部分工作都需要人工來做,工作量大,而且容易出錯。
ASON網(wǎng)絡的運維和管理
相比傳統(tǒng)傳輸網(wǎng)絡的運維和管理大部分靠人工完成,ASON網(wǎng)絡的運維和管理則主要是自動完成的。
ASON網(wǎng)絡中的電路調度是非常容易的,只需知道源和目的地址、帶寬需求、保護倒換等級,并指定選路的具體目標(如代價最小、跳數(shù)最少),控制平面就會按照要求自動選擇一條滿足條件的最優(yōu)路由。某些特殊的情況下需要指定是否必須經(jīng)過哪些節(jié)點/鏈路或者必須不經(jīng)過哪些節(jié)點/鏈路,是否需要業(yè)務均衡,還有是否要求SRLG(共享風險鏈路組)不相關等一些約束條件?! ?
ASON網(wǎng)絡中對告警做了專門的處理和分析,可以實現(xiàn)故障的自動定位,這種定位包括兩個層次,一是硬件故障,二是線路故障。正因為有了故障的立即尋址功能,ASON網(wǎng)絡才可以支持線路保護和業(yè)務保護共存,支持多粒度、多層次的網(wǎng)絡保護。目前,基于SDH的ASON的故障定位功能已經(jīng)初步實現(xiàn),基于OTN的ASON的故障定位功能比較復雜,因為其定位涉及到純光層告警的處理和分析。
ASON具有豐富的性能分析和強大的數(shù)據(jù)處理功能??梢院芊奖愕亟o出資源利用率的統(tǒng)計和分析、信道組織圖統(tǒng)計,還可以給出網(wǎng)絡故障分析,即分析網(wǎng)絡中單點故障情況下,網(wǎng)絡的受損情況,逐個點遍歷,以此得出哪個點的重要性最高;同樣可以對任意兩點進行遍歷,進而提供單點故障情況下,應該重點保護哪些區(qū)段。同理,也可以對多區(qū)段故障進行分析。此外,可以提供鏈路資源利用率的比較、業(yè)務路徑顯示,還可以選擇對某鏈路或者某個節(jié)點的資源占用情況單獨分析和處理,并且給出升級擴容的建議。
網(wǎng)絡優(yōu)化規(guī)劃工具是ASON相比傳統(tǒng)傳輸網(wǎng)絡所獨有的一個部分,也是相對獨立的一個部分。網(wǎng)絡優(yōu)化規(guī)劃的功能很多,可以用作初期的網(wǎng)絡規(guī)劃,對提出的網(wǎng)絡方案做技術經(jīng)濟的可行性分析,并對影響因素做靈敏度分析,得出對CAPEX和OPEX影響最大的因素,對其做特殊重點的考慮??梢杂米髻Y源的優(yōu)化,對使用不合理的資源進行重路由,以使得全網(wǎng)的資源利用趨于合理,還可以進行碎片整理,節(jié)約網(wǎng)絡資源。優(yōu)化規(guī)劃工作一般是離線進行的,但是它有和現(xiàn)網(wǎng)的接口,可以在線把現(xiàn)網(wǎng)上的數(shù)據(jù)采集過來進行分析和處理,利用這些資料來對現(xiàn)網(wǎng)進行優(yōu)化分析,并把優(yōu)化后的數(shù)據(jù)逐條下載到網(wǎng)管上,動態(tài)實現(xiàn)對網(wǎng)絡優(yōu)化的管理。優(yōu)化規(guī)劃的目標很多,包括提高網(wǎng)絡生存性、提高資源利用率、降低投資、提高投資收益比等,具體優(yōu)化可以按照單目標進行,也可以按照多目標的方式進行,常用的應該是多目標優(yōu)化,即把最重要的目標作為優(yōu)化目標,其它目標作為約束條件來進行綜合的優(yōu)化和規(guī)劃。
此外,業(yè)務管理也是ASON獨有的一個部分,因為ASON網(wǎng)絡中可以引入一些新的業(yè)務,如OVPN、BoD、組播和帶SLA的服務,這就需要對這些業(yè)務進行管理和維護,這不僅需要安全性的設置,還需要依據(jù)需求隨時給客戶調整服務等級和帶寬,這些調整是在線進行的,不會對業(yè)務造成損傷。
運維變化帶來的好處和問題
不難比較,傳統(tǒng)網(wǎng)絡的運維和管理需要大量工作人員的參與,從路由的選擇到交叉連接的配置,從故障的定位到各種數(shù)據(jù)的處理,每一個環(huán)節(jié)都離不開網(wǎng)管和運維人員的直接參與,這無疑浪費了大量的人力,而且選路和優(yōu)化規(guī)劃時可能無法達到統(tǒng)一或者完善。但從另一方面講,也培養(yǎng)了大批非常了解網(wǎng)絡“狀態(tài)”的工作人員,在出現(xiàn)網(wǎng)絡故障的情況下,只要網(wǎng)絡中有剩余資源,網(wǎng)管人員就可以進行故障的恢復。而ASON網(wǎng)絡的智能性大大簡化了運維和管理工作,幾乎所有實際操作都由軟件來完成,運維網(wǎng)管人員需要做的不再是實際去操作,而是熟悉和掌握網(wǎng)管軟件的使用,特別是網(wǎng)管軟件中各種屬性參數(shù)如何設置,如SRLG、保護屬性、代價等,并且要了解這些屬性參數(shù)在實際算法中到底起到什么樣的作用。由于無需去人工配置和計算,運維網(wǎng)管人員可以很輕松的進行日常維護工作,但因其了解到的僅僅是一些屬性參數(shù)和一些基本的操作,如果對ASON運行原理沒有較深的了解的話,就可能對智能過度依賴,而時間長了就會造成對網(wǎng)絡不熟悉,這樣在出現(xiàn)軟件故障或者其它不可預測的重大故障導致智能保護失效的時候,就有可能無法及時采取有效措施對網(wǎng)絡進行人工操作來進行網(wǎng)絡的恢復。
從辯證的觀點來看,正是因為傳統(tǒng)的傳輸網(wǎng)絡不具備智能性,使得網(wǎng)絡運維和管理都需要工作人員參與,所以培養(yǎng)了一大批“智能”的運維和網(wǎng)管人員。而ASON網(wǎng)絡的智能性容易造成運維和管理人員對智能的依賴。所以,ASON的自動化在減輕工作量的基礎上給運維和管理人員也提出了新的要求,要求他們不僅僅了解如何操作ASON的網(wǎng)管系統(tǒng),能夠熟練地設置相關參數(shù),更為重要的是了解有關路由、保護恢復等參數(shù)設置的原理,還要定時地對網(wǎng)絡的各種資料進行統(tǒng)計、處理和分析,以清晰了解網(wǎng)絡的狀態(tài);同時對ASON設備在軟硬件平臺的可靠性、智能的可管理性、運維和管理的功能完善性、易操作易管理性等方面提出了更高的要求,特別是對控制平面故障情況下的運維和管理提出了特殊的要求,不僅要求控制平面的故障不能影響到正常業(yè)務,還要求控制平面有一定的自愈性。
ASON的優(yōu)化規(guī)劃功能的使用是網(wǎng)管和運維人員必須認真掌握的工具,網(wǎng)絡運行的狀態(tài)以及資料的處理和分析大多都需要該優(yōu)化規(guī)劃工具來執(zhí)行。目前,ASON優(yōu)化規(guī)劃工具是區(qū)分不同設備廠商產(chǎn)品成熟度的重要依據(jù),也是需要在運維中不斷改進和完善的重點內(nèi)容。優(yōu)化規(guī)劃工具的成熟與否直接影響到ASON網(wǎng)絡運維管理的好壞。
總結
ASON給網(wǎng)絡的運維帶來了革命性的變化,相比傳統(tǒng)傳輸網(wǎng)絡,它的智能性可以節(jié)約大量人力。之所以提出辯證的觀點來看ASON運維和管理,不是否認ASON帶來了運維和管理上的便利,而是肯定ASON帶來了網(wǎng)絡管理和運維上革命性的功績。只要運維和網(wǎng)管人員能充分掌握其工作原理,一定能在這場革命中受益匪淺。
評論