基于系統(tǒng)實(shí)時(shí)事件驅(qū)動(dòng)和時(shí)間驅(qū)動(dòng)相結(jié)合的調(diào)度方法
引言
本文引用地址:http://www.biyoush.com/article/149531.htm目前,虛擬化操作系統(tǒng)(hypervisor)廣泛應(yīng)用于服務(wù)器、PC機(jī)等,這些應(yīng)用領(lǐng)域?qū)?a class="contentlabel" href="http://www.biyoush.com/news/listbylabel/label/實(shí)時(shí)">實(shí)時(shí)性要求較低。隨著一些嵌入式實(shí)時(shí)應(yīng)用領(lǐng)域的發(fā)展,比如下一代手機(jī)對(duì)安全性、應(yīng)用聚合和云計(jì)算等方面的需求,需要采用虛擬化操作系統(tǒng)。傳統(tǒng)的虛擬化操作系統(tǒng)很難滿足這些應(yīng)用領(lǐng)域的實(shí)時(shí)性要求。經(jīng)過大量的測試與分析,發(fā)現(xiàn)虛擬化操作系統(tǒng)實(shí)時(shí)性差的主要源頭之一是調(diào)度算法實(shí)時(shí)性不佳。有必要對(duì)虛擬化操作系統(tǒng)的調(diào)度方法進(jìn)行實(shí)時(shí)性改造,使之可以應(yīng)用于實(shí)時(shí)性要求較高的場合。本文提出了一種基于系統(tǒng)事件驅(qū)動(dòng)和時(shí)間驅(qū)動(dòng)相結(jié)合的實(shí)時(shí)調(diào)度方法,經(jīng)實(shí)踐表明,該方法有效地解決了虛擬化操作系統(tǒng)在嵌入式系統(tǒng)應(yīng)用中帶來的實(shí)時(shí)性問題。
1 問題提出
基于虛擬化操作系統(tǒng)(hypervisor),可以實(shí)現(xiàn)單CPU上多個(gè)操作系統(tǒng)(GueSTOS)在相互隔離的內(nèi)存域(Domain)中同時(shí)運(yùn)行。如圖1所示,箭頭表示調(diào)度。其中的系統(tǒng)調(diào)度采用二級(jí)調(diào)度策略,虛擬化操作系統(tǒng)對(duì)GuestOS(Domain)進(jìn)行第一級(jí)調(diào)度,GuestOS對(duì)自身的任務(wù)進(jìn)行第二級(jí)調(diào)度,系統(tǒng)的實(shí)時(shí)性響應(yīng)很難保證。
圖1 虛擬化操作系統(tǒng)
對(duì)于第一級(jí)調(diào)度(Domain調(diào)度),傳統(tǒng)的調(diào)度策略都是基于時(shí)間片的調(diào)度方法(SEDF、BVT、ARR、Credit等),通常應(yīng)用于實(shí)時(shí)性要求較低的場合(網(wǎng)絡(luò)服務(wù)器等),對(duì)于實(shí)時(shí)性要求較高的場合(手機(jī)等),調(diào)度的實(shí)時(shí)性就很難滿足系統(tǒng)要求。具體表現(xiàn)為:CPU利用率低、中斷響應(yīng)緩慢、GuestOS之間數(shù)據(jù)通信速率不足等。為了改進(jìn)這些性能,必須設(shè)計(jì)一種新的滿足實(shí)時(shí)性應(yīng)用場合的調(diào)度方法。根據(jù)實(shí)際測試和分析,發(fā)現(xiàn)實(shí)時(shí)性響應(yīng)差的主要瓶頸在于GuestOS不能夠得到及時(shí)的調(diào)度。
本文的方法主要對(duì)第一級(jí)調(diào)度策略進(jìn)行改造,即改造虛擬化操作系統(tǒng)對(duì)GuestOS(Domain)的調(diào)度方法。
2 解決方法
本文的方法采用系統(tǒng)實(shí)時(shí)事件驅(qū)動(dòng)Domain調(diào)度器的策略。當(dāng)系統(tǒng)中有需要實(shí)時(shí)響應(yīng)的緊急或重要事件發(fā)生時(shí),這些事件有機(jī)會(huì)驅(qū)動(dòng)Domain調(diào)度器產(chǎn)生調(diào)度行為,使之(緊急或重要事件)得到快速處理。當(dāng)沒有緊急或重要事件發(fā)生時(shí),Domain調(diào)度器采用基于時(shí)間片(權(quán)重)的調(diào)度算法。
2.1 調(diào)度原則
圖2表示了調(diào)度原則。圖2中,系統(tǒng)硬件中斷、GuestOS事件發(fā)送、Guest Idle之類的緊急或重要事件發(fā)生時(shí),有機(jī)會(huì)通過強(qiáng)原則去驅(qū)動(dòng)Domain調(diào)度器,切換Domain使之得到快速處理。當(dāng)系統(tǒng)中沒有緊急或重要事件發(fā)生時(shí),Domain調(diào)度器通過弱原則進(jìn)行調(diào)度(時(shí)間片等)。
圖2 調(diào)度原則
2.2 實(shí)時(shí)性分析
以中斷處理為例分析中斷響應(yīng)時(shí)間,如圖3所示。從圖3中可以看到,原調(diào)度策略的中斷響應(yīng)時(shí)間包含:“等待Domain調(diào)度時(shí)間片結(jié)束” + “Doamin切換”。新的調(diào)度策略,僅包含“Doamin切換”時(shí)間。可見,采用新的策略,中斷的實(shí)時(shí)性響應(yīng)得到了提高。
圖3 中斷實(shí)時(shí)響應(yīng)分析
虛擬操作系統(tǒng)應(yīng)用中常會(huì)有以下3類事件的實(shí)時(shí)響應(yīng)需要考慮:
0類事件--底層硬件中斷需要得到上層某個(gè)Domain的快速響應(yīng)處理;
1類事件--Domain(GuestOS)之間的通信事件需要被另一個(gè)Doamin快速處理;
2 類事件--Domain(GuetOS)中的任務(wù)空閑時(shí),主動(dòng)放棄CPU,通知Domain調(diào)度器使其他Domain(GuestOS)得到運(yùn)行機(jī)會(huì)。
這些事件的實(shí)時(shí)性響應(yīng)時(shí)間分析和中斷響應(yīng)類似。
在本方法中,如圖4所示,上述的3類事件都以設(shè)置觸發(fā)事件的形式驅(qū)動(dòng)Domain調(diào)度器,Domain調(diào)度器可以根據(jù)這些事件組合、當(dāng)前的GuestOS狀態(tài)組合、當(dāng)前的Domain調(diào)度狀態(tài)來產(chǎn)生調(diào)度決策。
2.3 方法實(shí)施
2.3.1 事件定義
本方法具體實(shí)現(xiàn)時(shí),根據(jù)實(shí)時(shí)系統(tǒng)的具體應(yīng)用情況,首先定義出緊急/重要事件(需要引發(fā)調(diào)度才能滿足實(shí)時(shí)響應(yīng)要求的事件),并按照2.2節(jié)所述的3類實(shí)時(shí)事件劃分,對(duì)其分類并設(shè)計(jì)優(yōu)先級(jí)排序。0類事件優(yōu)先級(jí)最高,1類事件優(yōu)先級(jí)居中,2類事件優(yōu)先級(jí)最低,每類事件自身也按照優(yōu)先級(jí)排序。
2.3.2 狀態(tài)定義
然后,根據(jù)系統(tǒng)設(shè)計(jì)和運(yùn)行情況列出Domain狀態(tài)組合、GuestOS狀態(tài)組合,如表1、表2所列。最后,根據(jù)系統(tǒng)運(yùn)行要求,設(shè)計(jì)出驅(qū)動(dòng)事件調(diào)度查詢表,如表3所列。
表1給出了GuestOS運(yùn)行狀態(tài)組合,表示每個(gè)guestOS中的任務(wù)運(yùn)行情況。每個(gè)GuestOS可以處于Run或Idle兩個(gè)狀態(tài),多個(gè)GuestOS的狀態(tài)組合起來(本文用2個(gè)GuestOS說明),就可以制作出GuestOS的狀態(tài)組合表。
表1 GuestOS狀態(tài)組合
圖4 基于事件驅(qū)動(dòng)的實(shí)時(shí)調(diào)度方法
表2 Domain狀態(tài)組合
表2表示了Domain狀態(tài)組合。表示Domain調(diào)度器的調(diào)度情況,每個(gè)Domain可以處于Run或Ready兩個(gè)狀態(tài),多個(gè)Domain的狀態(tài)組合起來(本文采用2個(gè)Domain),就可以制作出Doamin的狀態(tài)組合表。
表3 調(diào)度查詢表
表3是調(diào)度查詢表。調(diào)度觸發(fā)事件可以通過它查詢到下一個(gè)需要被調(diào)度運(yùn)行的GuestOS.它是一個(gè)二維的數(shù)組,其中列的維度由調(diào)度觸發(fā)事件表示,優(yōu)先級(jí)從高向低排列,另一個(gè)行的維度由GuestOS狀態(tài)組合表示,包含表1的所有GuestOS狀態(tài)組合。通過這兩個(gè)維度的輸入,可以查詢到預(yù)期的需要被調(diào)度的GuestOS(Domain),作為調(diào)度器下一次調(diào)度決策的輸入。
2.3.3 事件置位與清除規(guī)則
2.2節(jié)圖4中表示了調(diào)度事件置位和清除規(guī)則,說明了3種類型的調(diào)度觸發(fā)事件是如何設(shè)置和清除的。
事件置位和清除規(guī)則時(shí)序如圖5所示。圖5表示了3種類型的調(diào)度觸發(fā)事件的設(shè)置和清除時(shí)機(jī),以及事件驅(qū)動(dòng)策略和時(shí)間片驅(qū)動(dòng)策略的切換時(shí)機(jī),其中S_timer的關(guān)閉/打開分別表示開始事件驅(qū)動(dòng)調(diào)度/開始時(shí)間片驅(qū)動(dòng)調(diào)度。圖中有5種事件置位/清除操作,其中虛線箭頭表示的5種操作是在GuestOS中進(jìn)行的,需要采用超級(jí)調(diào)用(hypercall)實(shí)現(xiàn),其中的硬件中斷事件置位操作(實(shí)線箭頭)是在虛擬化操作系統(tǒng)特權(quán)空間中進(jìn)行的,可以直接操作。
2.3.4 事件優(yōu)先級(jí)處理策略
當(dāng)調(diào)度觸發(fā)事件到來時(shí),首先設(shè)置事件標(biāo)識(shí)位,然后去檢查各類事件組中的標(biāo)識(shí)位。如果有更高優(yōu)先級(jí)的事件存在,返回;如果沒有,再檢查自己是否是第一個(gè)觸發(fā)事件。如果是,關(guān)閉時(shí)間片驅(qū)動(dòng)調(diào)度策略,開始事件驅(qū)動(dòng)調(diào)度策略 (關(guān)閉S_timer),然后去查詢事件驅(qū)動(dòng)調(diào)度表,對(duì)比當(dāng)前Domain判斷是否需要產(chǎn)生調(diào)度。
當(dāng)調(diào)度觸發(fā)事件響應(yīng)處理完成后,需要調(diào)用hypercall清除,清除該事件的標(biāo)識(shí)位后,要先去檢查一下是否有比自己優(yōu)先級(jí)低的事件存在。如果有,就去處理它,查詢事件驅(qū)動(dòng)調(diào)度表,判斷是否需要產(chǎn)生新的調(diào)度;如果沒有比自己優(yōu)先級(jí)低的事件的存在,表示事件組中沒有其他事件存在了,啟動(dòng)事件片調(diào)度策略,結(jié)束事件驅(qū)動(dòng)調(diào)度策略 (打開S_timer)。
圖5 事件置位和清除規(guī)則時(shí)序圖
3 測試結(jié)果與分析
3.1 測試結(jié)果
硬件測試環(huán)境:ARM926EJS、主頻226 MHz、64 MB SDRAM、I/D Cache 16 KB/16 KB enable、MMU enable.軟件平臺(tái):自研虛擬化操作系統(tǒng)(基于Xen)、Threadx、Linux(參考圖1)。測試軟件采用LMBench,以及根據(jù)實(shí)際應(yīng)用場景設(shè)計(jì)的大量測試用例。
對(duì)本文提出的調(diào)度方法和常用的BVT調(diào)度算法進(jìn)行對(duì)比測試,測試結(jié)果表明系統(tǒng)的實(shí)時(shí)性響應(yīng)和系統(tǒng)的運(yùn)行性能都有較大幅度的提升。根據(jù)對(duì)大量測試數(shù)據(jù)的統(tǒng)計(jì),得到以下3個(gè)結(jié)果:
?、?GuestOS系統(tǒng)運(yùn)行性能的平均加速比為:threadx 1.82,Linux 1.94.
② 中斷響應(yīng)加速比為:單個(gè)GuestOS運(yùn)行時(shí)為8474,兩個(gè)GuestOS同時(shí)運(yùn)行時(shí)為15.6015.且響應(yīng)時(shí)間平穩(wěn),有良好的可預(yù)測性。
?、?GuestOS之間的數(shù)據(jù)通信速度加速比為12.51,且速率穩(wěn)定。
3.2 測試分析
經(jīng)過實(shí)踐應(yīng)用表明,本文提出的方法有效地解決了虛擬化操作系統(tǒng)傳統(tǒng)調(diào)度方法帶來的CPU利用率低、中斷響應(yīng)緩慢、操作系統(tǒng)(GuestOS)之間數(shù)據(jù)通信速度慢等問題。
評(píng)論