當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 湖南OA系統(tǒng) > 長(zhǎng)沙OA系統(tǒng) > 長(zhǎng)沙OA軟件行業(yè)資訊
修復(fù)微軟Hyper-V虛擬機(jī)集群?jiǎn)栴}
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
文章來(lái)源:泛普軟件這個(gè)系列包含四個(gè)部分,主要專注于微軟Hyper-V虛擬機(jī)集群?jiǎn)栴}的解決方法。所提到的問(wèn)題及解決辦法包含了來(lái)自微軟、硬件廠商和個(gè)人的技巧,這些技巧有助于虛擬環(huán)境的總體穩(wěn)定性。
這里邊的許多技巧不僅僅適用于Hyper-V,也可能適用于VMware和Citrix XenServer。第一部分涉及硬件、驅(qū)動(dòng)、補(bǔ)丁和配置等四類可能引起虛擬化環(huán)境不穩(wěn)定的因素。
所有的這些虛擬機(jī)問(wèn)題都曾經(jīng)折騰過(guò)我,導(dǎo)致我的Hyper-V集群環(huán)境變得不穩(wěn)定。我的目的就是告訴你這些問(wèn)題以便你能未雨綢繆。
固件升級(jí)
升級(jí)固件對(duì)穩(wěn)定性至關(guān)重要。在集群模式下,這不僅僅是BIOS的更新,因?yàn)槟惚仨毧紤]到完整的數(shù)據(jù)路徑,因此這要比單機(jī)環(huán)境復(fù)雜得多。一個(gè)固件的升級(jí)可以影響B(tài)IOS、HBA卡、光纖交換機(jī)和SAN存儲(chǔ)控制器。
當(dāng)我把Hyper-V遷移到刀片服務(wù)器之后,發(fā)現(xiàn)有很多因素可能影響虛擬化環(huán)境的穩(wěn)定性。相比機(jī)架式環(huán)境,刀片環(huán)境中,刀片機(jī)箱需要更新大量部件的固件。因此,當(dāng)我要升級(jí)某個(gè)部件的固件時(shí),我不得不考慮該固件是否與環(huán)境中其他的、舊的固件有關(guān)。
以前,我發(fā)現(xiàn)我們的HP Virtual Connect網(wǎng)絡(luò)設(shè)備會(huì)自動(dòng)重置。而機(jī)箱內(nèi)的其他刀片卻沒(méi)有這個(gè)問(wèn)題。不過(guò),當(dāng)主網(wǎng)絡(luò)和集群心跳失去連接30到45秒的情況下,Hyper-V集群則會(huì)出現(xiàn)問(wèn)題。表現(xiàn)出好像有故障產(chǎn)生,而其他的集群節(jié)點(diǎn)會(huì)將虛擬機(jī)遷移到其余的主機(jī)上。
查看HP的文檔后發(fā)現(xiàn),Virtual Connect網(wǎng)絡(luò)設(shè)備的固件有一個(gè)缺陷,不過(guò),在更新該固件之前,BIOS、HBA、HP Onboard Administrator和Virtual Connect光纖交換機(jī)的固件都需要更新。當(dāng)時(shí)一共有六個(gè)機(jī)箱,花了三個(gè)星期的時(shí)間,還好,更新完后,系統(tǒng)又穩(wěn)定起來(lái)了。
主機(jī)驅(qū)動(dòng)
對(duì)現(xiàn)有的硬件來(lái)說(shuō),新的驅(qū)動(dòng)總是會(huì)出現(xiàn)。雖然我不會(huì)僅僅因?yàn)樾掳姹镜尿?qū)動(dòng)出來(lái)了就趕緊去更新,不過(guò),有的情況確實(shí)需要更新。通常,當(dāng)新的固件更新之后,就需要更新與之對(duì)應(yīng)的許多驅(qū)動(dòng)。
與固件升級(jí)相似,集群環(huán)境下的驅(qū)動(dòng)升級(jí)也是關(guān)聯(lián)頗多。請(qǐng)記?。涸诩耗J较?,驅(qū)動(dòng)的一致性極為重要。
就拿FC HBA卡或者iSCSI驅(qū)動(dòng)來(lái)說(shuō)。特別是每一個(gè)連接到MPIO架構(gòu)中的卡。當(dāng)使用EMC PowerPath或者HP MPIO架構(gòu)時(shí),為所有集群節(jié)點(diǎn)匹配與MPIO級(jí)別對(duì)應(yīng)的驅(qū)動(dòng)很重要。
在某些情況下,混用和匹配MPIO級(jí)別驅(qū)動(dòng)會(huì)引起集群的Failover功能失效。不僅HBA卡驅(qū)動(dòng)會(huì)引起這個(gè)問(wèn)題,當(dāng)集群中網(wǎng)絡(luò)或者電源管理模塊的驅(qū)動(dòng)不一致時(shí),也會(huì)發(fā)生其他的問(wèn)題。
以前,我為集群增加節(jié)點(diǎn)時(shí),曾經(jīng)遇到過(guò)這些問(wèn)題。那時(shí),最新的MPIO、HBA和網(wǎng)絡(luò)驅(qū)動(dòng)都安裝好了??墒?,新舊節(jié)點(diǎn)驅(qū)動(dòng)的不匹配導(dǎo)致我的虛擬化集群環(huán)境不穩(wěn)定并且有不可預(yù)知的問(wèn)題。
那么,我的建議是什么? 為每一個(gè)節(jié)點(diǎn)安裝與目前固件匹配的同一版本的驅(qū)動(dòng)。有時(shí),大部分最新的固件更新都是最好的。我傾向于堅(jiān)持用穩(wěn)定的版本。那就是說(shuō),如果因?yàn)槟承┰蛞惭b新的驅(qū)動(dòng),就要試著立刻為每個(gè)主機(jī)都安裝該驅(qū)動(dòng)。
補(bǔ)丁
服務(wù)器的虛擬化仍然處于成長(zhǎng)中。盡管廠商的推動(dòng)為虛擬化環(huán)境帶來(lái)了很多新的功能,但是這些新的特色和功能不可避免的有缺陷從而導(dǎo)致問(wèn)題發(fā)生。雖然廠商們會(huì)經(jīng)常發(fā)布補(bǔ)丁,但是,有的時(shí)候,你很難找到這些補(bǔ)丁。
在我的Hyper-V集群中,僅有少數(shù)的案例需要較長(zhǎng)的電話溝通來(lái)解決。大部分案例,我都會(huì)在問(wèn)題發(fā)生之前找到補(bǔ)丁,或者給微軟的技術(shù)支持一個(gè)簡(jiǎn)短的電話就可以搞定。
以下是我尋找補(bǔ)丁的三個(gè)站點(diǎn):
Microsoft Hyper-v
VMware
Citrix System’s XenServer
這些站點(diǎn)都非常有用,不過(guò),微軟支持博客通常更有用。下次,當(dāng)你與微軟的技術(shù)支持通電話的時(shí)候,你可以問(wèn)下他們是否有一個(gè)博客給出了你所遇到的問(wèn)題的解決方法。另外,有一些對(duì)最新補(bǔ)丁的解析和增強(qiáng)會(huì)來(lái)自技術(shù)前沿的專家。這里是幾個(gè)我收藏的博客:
Jonathan's Virtual Blog
Hyper-V Notes From the Field
Energized about IT
無(wú)論是集群還是單機(jī),從你的虛擬化軟件提供商獲取最新的主機(jī)或者虛擬機(jī)補(bǔ)丁都是非常重要的。這個(gè)技術(shù)進(jìn)展很快,因?yàn)楫a(chǎn)品bug造成主機(jī)故障將會(huì)是災(zāi)難性的。如果你想在你的虛擬化環(huán)境中增加一個(gè)復(fù)雜的集群,你必須定期尋找新的補(bǔ)丁。
自動(dòng)服務(wù)器恢復(fù)(ASR)重啟
ASR是一種服務(wù)器重啟機(jī)制,當(dāng)安裝代理感知到系統(tǒng)故障(比如,內(nèi)部錯(cuò)誤或者OS自鎖)的時(shí)候,它會(huì)以Gracefully的模式重啟服務(wù)器。如果你不使用Hyper-V,大部分廠商都有一個(gè)形似的功能。
我要”揭露”的ASR功能來(lái)自于HP硬件,許多次錯(cuò)誤的ASR行為導(dǎo)致我的主機(jī)集群冷斷電(在HP硬件上,有一些擁有相同問(wèn)題的其他例子)。為此,我禁用了ASR。該技術(shù)的可靠性遭到了懷疑,我也因該功能不理會(huì)是否有虛擬機(jī)在運(yùn)行就蠻橫的關(guān)掉服務(wù)器而對(duì)它喪失了信心。
在我的印象中,HP ProLiant BL460c虛擬主機(jī)很穩(wěn)定。內(nèi)存芯片可能會(huì)失效,驅(qū)動(dòng)也會(huì)間歇性的失效;另一方面,它的性能很不錯(cuò)。而HP附送的軟件則是另外一回事。我建議在BIOS中禁止ASR和激發(fā)重啟的代理,從而提高虛擬主機(jī)集群的可靠性。
最后,匹配固件和驅(qū)動(dòng),升級(jí)補(bǔ)丁,禁止ASR重啟將會(huì)為你的虛擬集群主機(jī)提供一個(gè)穩(wěn)定的基礎(chǔ)。在本系列的其他三個(gè)部分中,我將介紹其他的Hyper-V集群?jiǎn)栴}。雖然一些問(wèn)題是產(chǎn)品缺陷,一些是管理錯(cuò)誤和失誤。無(wú)論如何,我將提供一些技巧避免這些問(wèn)題和虛擬機(jī)停機(jī)。
- 1廈門(mén)OA軟件
- 2合肥OA軟件行業(yè)資訊
- 3杭州OA軟件
- 4鄭州OA軟件
- 5濟(jì)南OA軟件
- 6青島OA軟件
- 7太原OA軟件
- 8上海OA軟件
- 9上海OA軟件行業(yè)資訊
- 10石家莊OA軟件
- 11天津OA軟件
- 12沈陽(yáng)OA軟件
- 1網(wǎng)絡(luò)視頻監(jiān)控發(fā)展的5大驅(qū)動(dòng)勢(shì)力
- 2RFID應(yīng)用深入拓展 校園卡一卡多能
- 3開(kāi)福法院引進(jìn)的OA網(wǎng)絡(luò)辦公管理包括電子卷宗、便民訴訟服務(wù)
- 4基于可復(fù)用構(gòu)件思想的ETL架構(gòu)設(shè)計(jì)
- 5固態(tài)硬盤(pán):2010年存儲(chǔ)領(lǐng)域?qū)⑷绾紊涎?
- 6物流企業(yè)如何構(gòu)建BI系統(tǒng)模式?
- 7云服務(wù):降低風(fēng)險(xiǎn),保持可用性
- 8長(zhǎng)沙OA系統(tǒng)建立高效協(xié)同的運(yùn)營(yíng)管理模式
- 9使用NIC創(chuàng)建子網(wǎng)隔離Hyper-V的網(wǎng)絡(luò)流量
- 10全面介紹RAID7與RAID6磁盤(pán)陣列技術(shù)
- 11用開(kāi)源軟件建垂直搜索引擎
- 12電子證帶來(lái)的監(jiān)管變革 具有里程碑意義
- 13六步措施保障Web應(yīng)用安全
- 14如何構(gòu)建私有云
- 15磁盤(pán)備份與虛擬磁帶庫(kù)備份淺析
- 16對(duì)于部署入侵檢測(cè)系統(tǒng)的建議
- 17五個(gè)您必須立刻實(shí)施的組策略選項(xiàng)
- 18OA軟件的綜合事務(wù)處理與會(huì)議管理功能
- 19CPU與GPU融合之勢(shì)難擋
- 20當(dāng)云計(jì)算操作系統(tǒng)滅掉CMDB
- 21數(shù)據(jù)中心與云服務(wù),兩項(xiàng)服務(wù)可否共存?
- 223G無(wú)線監(jiān)控為何出現(xiàn)持續(xù)降溫局面
- 23視頻廣播、點(diǎn)播、會(huì)議,三者有何區(qū)別?
- 24基于業(yè)務(wù)解析的第五代計(jì)算機(jī)語(yǔ)言
- 25云存儲(chǔ)取得成功的三個(gè)關(guān)鍵因素
- 26如何讓IaaS服務(wù)免受DNS漏洞的威脅?
- 27Wi-Fi無(wú)線網(wǎng)絡(luò)運(yùn)維需要專業(yè)測(cè)試工具
- 28YiGo正在傾聽(tīng)的CIO心聲
- 29協(xié)同OA提供目錄結(jié)構(gòu)式的組織架構(gòu)管理功能
- 30電子認(rèn)證服務(wù)四大糾結(jié)
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓