云計算管理員們一般都工作在一個分布式局域網(wǎng)計算基礎(chǔ)設(shè)施中,它與傳統(tǒng)數(shù)據(jù)中心最大的區(qū)別之一就是,所有被存儲、調(diào)配和管理的數(shù)據(jù)都在一個私有云中?;谠朴嬎愕母咝Чぷ髫?fù)載監(jiān)控可在性能發(fā)生問題之前就提前發(fā)現(xiàn)這些問題的苗頭,從而防患于未然。了解你的云計算運行詳細(xì)信息將有助于交付一個更強大的云計算使用體驗。
收集云計算性能指標(biāo)
IT管理員們必須積極主動地收集和記錄云計算服務(wù)器的性能指標(biāo)與數(shù)據(jù),這主要是因為托管云計算工作負(fù)載的大多數(shù)服務(wù)器都是需要使用專用資源的虛擬機。對于云計算服務(wù)器來說,過度分配資源或分配資源不足都是一個需要付出高昂代價的錯誤。
適當(dāng)?shù)囊?guī)劃和工作負(fù)載管理是任何重大云計算部署工作之前必須實施的環(huán)節(jié)。當(dāng)收集運行專用工作負(fù)載的特定服務(wù)器的性能指標(biāo)時,管理員們必須評估如下參數(shù):
•CPU使用率:云計算服務(wù)器必須是物理的或虛擬的。管理員們必須查看機器,并確定用戶是如何訪問CPU資源的。當(dāng)無數(shù)用戶從云計算啟動桌面服務(wù)或應(yīng)用程序服務(wù)時,必須認(rèn)真考慮這臺服務(wù)器需要多少個專用核。
•RAM需求:基于云計算的工作負(fù)載可以是RAM密集型的。在一個特定服務(wù)器上監(jiān)控一個工作負(fù)載,可允許你衡量分配多少的RAM資源。其關(guān)鍵在于按需規(guī)劃而不過度分配資源,你可以通過工作負(fù)載監(jiān)控來實現(xiàn)這一目標(biāo)。通過查看一段時間內(nèi)RAM的使用情況,管理員們可以確定何時將會發(fā)生使用高峰以及相應(yīng)合適的RAM等級。
•存儲需求:規(guī)模規(guī)劃是云計算工作負(fù)載的重要一步。用戶設(shè)置和工作負(fù)載分配都需要空間資源。還必須檢查I/O:例如,使用中的引導(dǎo)和大規(guī)模應(yīng)用高峰都可以秒殺任何一個未對這類事件做好預(yù)案和采取措施的SAN。通過監(jiān)控I/O和控制器指標(biāo),管理員們可以確定特定存儲系統(tǒng)的性能水平。你可以使用固態(tài)硬盤(SSD)或板載閃存緩存以阻止I/O高峰。
•網(wǎng)絡(luò)設(shè)計:網(wǎng)絡(luò)及其架構(gòu)在云計算基層設(shè)施與工作負(fù)載中起了一個非常重要的作用。監(jiān)控數(shù)據(jù)中心和云計算內(nèi)的網(wǎng)絡(luò)將有助于確定特定速度需求。從服務(wù)器到SAN通過10GbE連接的光纖交換機上行鏈路將有助于減少瓶頸和改善云計算工作負(fù)載性能。
性能監(jiān)控工具也是非常有用的。Citrix系統(tǒng)公司的EdgeSight收集服務(wù)器和端點等級的端點性能指標(biāo)。通過理解云計算服務(wù)器是如何運行以及了解最終客戶需求,管理員們可以確定合適的物理基礎(chǔ)設(shè)施規(guī)模以便于支持虛擬實例。
工作流程自動化的優(yōu)勢
主動云計算工作負(fù)載監(jiān)控可執(zhí)行收集指標(biāo)和統(tǒng)計數(shù)據(jù)的任務(wù)。在發(fā)生應(yīng)用高峰時,許多系統(tǒng)都可以監(jiān)控工作負(fù)載并提供工作流程自動化服務(wù)。
某些諸如旅游業(yè)這樣的市場,往往在一年中的特定時間段會發(fā)生使用高峰事件。為了應(yīng)對這樣的突發(fā)事件,可以設(shè)置工作負(fù)載閾值,以便于一旦需求增加超過預(yù)設(shè)值時可創(chuàng)建新的虛擬機。因此,最終用戶將總是可以訪問數(shù)據(jù)和保持正常的工作負(fù)載,而無需做出性能犧牲。
工作流程自動化還有助于災(zāi)難恢復(fù)和備份等任務(wù)。由于在無數(shù)網(wǎng)站之間發(fā)生了數(shù)據(jù)復(fù)制操作,因此當(dāng)另一個網(wǎng)站發(fā)生數(shù)據(jù)丟失時,遠(yuǎn)程的另一個網(wǎng)站就會承擔(dān)這一工作負(fù)載。適當(dāng)?shù)墓ぷ髫?fù)載監(jiān)控和數(shù)據(jù)中心設(shè)計可以有助于提升系統(tǒng)的穩(wěn)定性,而更為重要的是提高業(yè)務(wù)的連續(xù)性。
云計算監(jiān)控提示
這里列出了一些有助于保持你私有云工作負(fù)載正常運行的規(guī)則:
了解你的物理資源。盡管在最初的時候物理資源似乎是無窮無盡的,但是事實上它們終究是有窮盡的。如果沒有適當(dāng)?shù)乇O(jiān)控和調(diào)配這些資源,這些資源會非常迅速地被用盡。云計算工作負(fù)載可以提出需求。規(guī)劃是必須的。
主動保留運行日志。除了主動地監(jiān)控云計算工作負(fù)載,云計算管理人員應(yīng)當(dāng)記錄在一段時間內(nèi)這一工作負(fù)載或服務(wù)器是如何運行的。云計算服務(wù)器可以升級,工作負(fù)載可以在不同物理主機之間遷移。在這些情況下,知道特定新舊服務(wù)器是如何分別設(shè)置運行可以有助于計算擁有總成本和投資回報。在很多情況下,良好的性能日志可以提供有用的統(tǒng)計信息以便于證明數(shù)據(jù)中心新增預(yù)算的合理性。
監(jiān)控端點。從數(shù)據(jù)中心的角度來看,工程師能夠監(jiān)控和管理活動的工作負(fù)載。在端點處監(jiān)控工作負(fù)載活動也是非常重要的。通過了解工作負(fù)載是如何被傳遞、是如何被接受,IT團隊可以創(chuàng)建一個更為積極的計算體驗。
當(dāng)用戶訪問一個云計算中的工作負(fù)載時,管理員們就可以查看他們所使用的連接類型、數(shù)據(jù)如何傳至端點以及是否有任何修改。在某些情況下,管理員們可能要使用到數(shù)據(jù)壓縮或帶寬優(yōu)化等技術(shù),從而使工作負(fù)載在端點處正常運行。
【推薦閱讀】
◆網(wǎng)管軟件專區(qū)
◆云計算如何幫助企業(yè)降低IT運維成本
◆云計算服務(wù)給IT業(yè)帶來的影響
◆預(yù)測2012云計算市場發(fā)展及工作實施計劃
◆IT運維管理專區(qū)
本文來自互聯(lián)網(wǎng),僅供參考