云計算技術及其應用

作者：時間：2016-09-12 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

本文引用地址：http://www.biyoush.com/article/201609/304025.htm

對于服務器虛擬化的異構問題，可以從兩個層面去解決：(1)通過資源池的分組，對不同架構的服務器和小型機進行虛擬化，不同架構的資源池歸于一個獨立的組，針對不同的應用，分配特定的虛擬機資源。(2)通過業(yè)務的定制和調度，將不同架構的虛擬化平臺通過管理融合，實現異構虛擬機的調度。

異構資源池如圖2所示。在云計算平臺中，把IBM的PowerSystems小型機集群通過IBM的PowerVM系統(tǒng)虛擬為基于 PowerSystems架構的計算資源池，把HP的小型機集群通過HP的VSE系統(tǒng)虛擬為基于HP架構的計算資源池，把X86架構的計算資源通過 XENKVM系統(tǒng)虛擬為基于X86的ZXVE資源池。在業(yè)務部署時，不同的應用的可以根據自己的業(yè)務特點和操作系統(tǒng)特點，選擇性地部署在不同的資源池上，從而實現虛擬化對各類小型機的異構。X86架構的計算資源池、PowerSystems架構的計算資源池和HP架構的計算資源池分別受各自的虛擬化管理軟件(如VMM、IVM和gWLM)管理。在VMM、IVM和gWLM的上層，可以通過融合的虛擬化管理器(iVMM)，對3個計算資源池進行統(tǒng)一管理。

圖3所示為虛擬資源對應用實現異構的方法。此方法的核心在于4個方面：iVMM、業(yè)務調度器、業(yè)務系統(tǒng)針對不同的資源池架構提供應用功能相同的不同版本、iVMM和業(yè)務調度器之間的OCCI擴充接口。

在業(yè)務應用層面，針對業(yè)務系統(tǒng)，本文增加業(yè)務調度器模塊。業(yè)務調度器根據業(yè)務的繁忙程度，向iVMM申請增加或減少虛擬機資源，并調整負載均衡策略。業(yè)務系統(tǒng)針對不同的資源池架構，需要準備與之對應的功能相同的不同版本。OCCI擴充接口的工作流程為：

業(yè)務系統(tǒng)的業(yè)務調度器通過OCCI接口向云計算平臺申請資源，同時向云計算平臺提供業(yè)務系統(tǒng)可以支持的操作系統(tǒng)等信息，并提供優(yōu)先級信息。

云計算平臺根據業(yè)務系統(tǒng)的請求和云內資源的空閑情況，分配計算資源，通過OCCI接口通知業(yè)務調度器云計算平臺向業(yè)務系統(tǒng)提供了何種架構的計算資源。

業(yè)務調度器根據申請到的資源情況，將業(yè)務處理機的操作系統(tǒng)、業(yè)務版本等模板信息通過OCCI接口通知云計算平臺，由云計算平臺進行操作系統(tǒng)和業(yè)務程序的部署，完成后提交給業(yè)務系統(tǒng)進行使用。

3 分布式技術

分布式技術最早由Google規(guī)模應用于向全球用戶提供搜索服務，因此必須要解決海量數據存儲和快速處理的問題。其分布式的架構，可以讓多達百萬臺的廉價計算機協同工作。分布式文件系統(tǒng)完成海量數據的分布式存儲，分布式計算編程模型MapReduce完成大型任務的分解和基于多臺計算機的并行計算，分布式數據庫完成海量結構化數據的存儲?；ヂ摼W運營商使用基于Key/Value的分布式存儲引擎，用于數量巨大的小存儲對象的快速存儲和訪問。

3.1 分布式文件系統(tǒng)

分布式文件系統(tǒng)的架構，不管是Google的GFS還是Hadoop的HDFS，都是針對特定的海量大文件存儲應用設計的。系統(tǒng)中有一對主機，應用通過文件系統(tǒng)提供的專用應用編程接口(API)對系統(tǒng)訪問。分布式文件系統(tǒng)的應用范圍不廣的原因主要為：主機對應用的響應速度不快，訪問接口不開放。

主機是分布式文件系統(tǒng)的主節(jié)點。所有的元數據信息都保存在主機的內存中，主機內存的大小限制了整個系統(tǒng)所能支持的文件個數。一百萬個文件的元數據需要近 1G的內存，而在云存儲的應用中，文件數量經常以億為單位;另外文件的讀寫都需要訪問主機，因此主機的響應速度直接影響整個存儲系統(tǒng)的每秒的讀入輸出次數 (IOPS)指標。解決此問題需要從3個方面入手：

(1)在客戶端緩存訪問過的元數據信息。應用對文件系統(tǒng)訪問時，首先在客戶端查找元數據，如果失敗，再向主機發(fā)起訪問，從而減少對主機的訪問頻次。

(2)元數據信息存放在主機的硬盤中，同時在主機的內存中進行緩存，以解決上億大文件的元數據規(guī)模過大的問題。為提升硬盤可靠性和響應速度，還可使用固態(tài)硬盤(SSD)硬盤，性能可提升10倍以上。

(3)變分布式文件系統(tǒng)主機互為熱備用的工作方式為1主多備方式(通常使用1主4備的方式)，通過鎖服務器選舉出主用主機，供讀存儲系統(tǒng)進行改寫的元數據訪問服務，如果只是讀訪問，應用對元數據的訪問將被分布式哈希表(DHT)算法分配到備用主機上，從而解決主機的系統(tǒng)“瓶頸”問題

對于分布式文件系統(tǒng)，外部應用通過文件系統(tǒng)提供的專用API對其進行訪問，這影響了分布式文件系統(tǒng)的應用范圍。對于標準的POSIX接口，可以通過 FUSE的開發(fā)流程實現，但將損失10%~20%的性能。對于網絡文件系統(tǒng)(NFS)，在實現POSIX接口的基礎上，可以直接調用Linux操作系統(tǒng)的 NFS協議棧實現。

3.2 Key/Value存儲引擎

Key/Value存儲引擎最大的問題在于路由變更后，數據如何快速地實現重新分布。Key/Value存儲引擎如圖4所示?？梢砸M虛擬節(jié)點的概念，將整個Key值映射的RING空間劃分成Q個大小相同的Bucket(虛擬節(jié)點，Key的映射算法推薦采用MD5)。每個物理節(jié)點根據硬件配置情況負責多個 Bucket區(qū)間的數據。同一個Bucket上的數據落在不同的N 個節(jié)點上，通常情況下N =3。我們將DCACHE的Q設定成10萬，即把整個RING空間分成了10萬份，如果整個DCACHE集群最大容量為50 TB，每個區(qū)間對應的數據大小僅為500 MB。對500 MB的數據進行節(jié)點間的遷移時間可以少于10 s。圖4中，N =3，Bucket A中的數據存儲在B、C、D 3個節(jié)點。

Key/Value存儲引擎是一個扁平化的存儲結構，存儲內容通過Hash算法在各節(jié)點中平均分布。但是在一些應用中，業(yè)務需要對Key/Value存儲引擎進行類似目錄方式的批量操作(如在CDN項目中，網站向CDN節(jié)點推送內容時，需要按照網頁的目錄結構進行增加和刪除)，Key/Value存儲引擎無法支持這樣的需求?？梢栽贙ey/Value存儲引擎中增加一對目錄服務器，存儲Key值與目錄之間的對應關系，用于對目錄結構的操作。當應用訪問 Key/Value存儲引擎時，仍然按照Hash方式將訪問對應到相應的節(jié)點中，當需要目錄操作時，應用需要通過目錄服務器對Key/Value存儲引擎進行操作，目錄服務器完成目錄操作和Key/Value方式的轉換。由于絕大多數項目中，大部分為讀操作，因此目錄服務器參與對Key/Value引擎訪問的次數很少，不存在性能“瓶頸”。