當前位置:工程項目OA系統(tǒng) > 泛普各地 > 遼寧OA系統(tǒng) > 沈陽OA系統(tǒng) > 沈陽OA行業(yè)資訊
綠色節(jié)能為先 集群服務器功耗管理
集群服務器獲得廣泛應用的主要原因在于其較高的性價比,通過數(shù)量上的優(yōu)勢來彌補節(jié)點處理性能的不足。節(jié)點數(shù)量大幅增長的同時不可避免的帶來電力消耗的快速增長,IDC(international data corporation)研究數(shù)據(jù)表明,在2007年中國用于服務器的電源和冷卻的總開支達到了19億美元,僅在北京和廣東兩個地區(qū),這部分的投入就達到了3.2和3.6億美元,占到了全國的35.8%。據(jù)統(tǒng)計,中國2007年全年IT產品總耗電量在300億到500億度,相當于三峽電站一年的總發(fā)電量。巨大的耗能引來了各方的關注。
集群節(jié)點數(shù)量在快速增長,但其使用效率卻在低水平徘徊不前,以應用最普遍的X86服務器集群為例,普遍認為其利用率低于30%,IBM更是稱Intel服務器平均利用率只有10%,從而造成大量電力資源的浪費。
現(xiàn)代機房的功耗分布
集群服務器一般安裝在專用機房中,一般采用高架地板,標準機柜,UPS(Uninterruptible Power Supply),精密空調等設備。
可以明顯看出,服務器與冷卻設備在機房總功耗中共占到了80%以上的份額,顯而易見,冷卻設備的功耗是和服務器運行時產生的熱量密切相關的,如何更好的進行集群功耗管理就成為了關鍵。
集群功耗管理的要求
功耗管理屬于集群基礎設施管理的范疇,主要關心兩個方面的情況,一方面是怎樣把集群的實際負載與功耗聯(lián)系起來;另一方面是怎樣在不影響應用的前提下最小化集群的總功耗,最終目的是實現(xiàn)電力能源的量化與最優(yōu)化調度。由于是從集群的角度分析功耗,所以不涉及單節(jié)點的絕對功率的大小,例如為節(jié)點更換更節(jié)能的CPU就不在考慮之中。
基于上述思路,可以將集群功耗管理歸納為如下幾點功能:
集群功耗的實時監(jiān)控與分析
對集群功耗的監(jiān)控是實現(xiàn)功耗管理的基礎,可以通過兩種手段來實現(xiàn):通過在服務器電源模塊上增加功率感應器(功率計)使用主板的帶外管理模塊(BMC)直接讀取。該方式的優(yōu)點是簡單直接,缺點是精度受限,目前只能達到+-10%,而且必須將功率傳感器布置在電源AC端,由于刀片服務器采用共享電源無法探測每個刀片的功率,所以不能支持刀片服務器。另一種手段是服務器生產廠家在服務器生產之后標定各種負載條件下的服務器功率,用戶使用時打開節(jié)點上的監(jiān)控軟件,就能夠估算出節(jié)點的功率,只要廠家標定的負載樣本足夠多就可以實現(xiàn)較高的精度,同時,由于采用軟硬件結合的方式,無論是機架式還是刀片服務器均可支持。
在準確的集群實時功耗監(jiān)控基礎之上可以計算應用的功耗與能耗,通過對不同負載狀況集群功耗的分析可以得到應用的有效功耗與無效功耗,如果使用了作業(yè)調度系統(tǒng),更可以直接計算作業(yè)的能耗。 集群峰值功耗的控制
主要是基于三方面的考量:第一,集群的UPS與冷卻單元所能支撐IT設備最大功耗是決對不能超越的,因此用戶往往需要配置較多的冗余設備,而其利用率很低,如果能夠對集群功耗上限進行控制,可以相應的減少冗余設備數(shù)量,減少無效投資。第二,UPS與冷卻單元還對機柜的功耗密度有相應要求,設計功耗密度太高會使成本大幅提升,設計密度過低又會造成空間利用率低下,因此需要選擇一個合適的功耗密度。以前,功耗密度只能根據(jù)服務器的額定功率確定,而這個值幾乎很難在實際應用中達到,據(jù)此進行設計就不可避免的造成空間的浪費以及供電與冷卻設備的過度投資。準確地進行工作組級別,機柜級別和集群級別的功耗上限調整可以明顯提升設備使用率。第三,不同種類的應用負載特點是不同的,例如高性能計算通常CPU利用率較高,對節(jié)點間通訊延遲敏感,而互聯(lián)網應用往往更關心數(shù)據(jù)的快速讀寫,CPU利用率并不很高。即便是同一應用,其負載往往也會有大幅度的波動,下圖左側是某公司內部郵件服務器的負載情況,右側是負載的自相關函數(shù),可以看出負載有較明顯的周期性,根據(jù)應用的負載特點進行功耗上限的調整會明顯提升服務器的能效。
歷史負載分析與功耗分配策略
服務器運行的應用一般不會頻繁改變,可以將負載與功耗的實時數(shù)據(jù)保存下來形成歷史數(shù)據(jù),監(jiān)控系統(tǒng)據(jù)此可以自動分析負載的特點與發(fā)展趨勢并做出相應調整?,F(xiàn)有的自動控制技術可以給出多種策略,其細節(jié)超出本文范圍,不再一一贅述,但原則上既要保證功耗分配對負載波動的快速響應,又要避免過于頻繁的調整造成電力資源的浪費。完善的功耗分配策略可以使管理員將精力集中在對負載特點的分析上,而不用為其具體數(shù)值以及調整時間等細節(jié)耗費大量精力。如果使用了作業(yè)調度系統(tǒng),用戶可以引入新的算法,根據(jù)集群的功耗分布對作業(yè)進行調度,提升系統(tǒng)的能效。
熱量分布與冷卻設備控制
從上文對機房功耗分布的分析中可以看出冷卻系統(tǒng)的功耗僅次于IT設備,但事實上這部分功耗中的大部分被浪費掉了。圖一是現(xiàn)有機房進行的三維溫度分布模擬,從中可以看出,由于負載在機房中空間上與時間上是分布不均的,造成溫度的分布也是不均勻的,有熱點(圖中紅色部分)與冷點(圖中藍色部分),是典型的非穩(wěn)態(tài)熱力學系統(tǒng)!現(xiàn)有機房的散熱設計一般是基于熱力學穩(wěn)態(tài)系統(tǒng)進行的,造成了大量的能源浪費,有研究表明,有效制冷量不足50%。因此,通過建立熱力學散熱模型,基于集群功耗的實時監(jiān)控數(shù)據(jù)與功耗分配策略進行精確制冷是必然的發(fā)展方向。
集群功耗管理的發(fā)展趨勢
現(xiàn)有數(shù)據(jù)中心的各種設備大多是單獨進行管理的,例如盤陣,服務器,UPS,空調等,筆者認為其管理模式將向兩個方向發(fā)展,一方面要根據(jù)外部環(huán)境變化和負載的波動進行統(tǒng)一任務調度并調節(jié)各種設備,實現(xiàn)更廣泛意義上的最優(yōu)化調度;另一方面,管理的粒度會更細,例如對每節(jié)點的任務進行調整,對每個 CPU內核的主頻進行單獨調整,進行分區(qū)冷卻等。
這兩方面是相輔相成的,統(tǒng)一管理是精細管理的基礎,精細管理是統(tǒng)一管理的實現(xiàn)手段。(CIO時代網)
- 1數(shù)據(jù)中心冷卻:綠色環(huán)??滩蝗菥?/a>
- 2SOA在云計算中具有重要作用
- 3美政府廣招黑客 欲全面打擊網絡犯罪
- 4OA系統(tǒng)支持集中式部署和分布式部署兩種模式
- 5信息如何存儲 云計算有國界嗎?
- 6集成即服務:面向云的數(shù)據(jù)集成
- 7沈陽泛普OA信息化策略與實現(xiàn)方案
- 8虛擬化應用是否提高了服務器的工作量
- 9企業(yè)無線與有線網絡一體化部署應謹慎
- 10演示:如何將數(shù)據(jù)中心遷移到云上
- 11有線網絡前端機房設備選型與維護
- 12沈陽騰業(yè)建設招投標有限責任公司招標OA辦公軟件,受沈陽市東陵區(qū)教育局的委托
- 13五個步驟改進存儲容量規(guī)劃
- 14在網絡中部署FTP服務器的四點經驗
- 15透過宣傳迷霧了解服務器虛擬化真相
- 16云計算平臺只是提供云服務的第一步
- 17傳統(tǒng)歸檔到云存儲歸檔的進化演變
- 18降低服務器虛擬化的四大安全風險
- 19分析:七步解決服務器I/O成本問題
- 20八種方法對現(xiàn)有數(shù)據(jù)中心進行“綠化”
- 21視頻會議能夠為企業(yè)真正帶來什么?
- 22鎖好數(shù)據(jù)防盜門 走出安全誤區(qū)
- 23H1N1下的企業(yè)“虛擬化”生存之道
- 24中小企業(yè)以虛擬化和iSCSI解決存儲難題
- 25深入Java對象和元素的存儲區(qū)域
- 26如何利用現(xiàn)有設施部署安全的無線網絡?
- 27股份公司OA辦公系統(tǒng)證照管理和會議管理實施功能簡介
- 28虛擬化對災難恢復有多少幫助?
- 29云計算終端瀏覽器:需要?不需要?
- 30改進存儲容量規(guī)劃的五個步驟
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓