當前位置:工程項目OA系統(tǒng) > 泛普服務(wù)體系 > 泛普博客
網(wǎng)絡(luò)管理員如何解決上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象
局域網(wǎng)網(wǎng)絡(luò)使用起來很方便,但管理起來卻不是一件容易的事情,單單用戶不同的上網(wǎng)需求,就能讓網(wǎng)絡(luò)管理員忙得不亦樂乎,更不用說頻繁出現(xiàn)的各種網(wǎng)絡(luò)故障了。這不,上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象十分常見,引起該故障的因素也是復(fù)雜、多變,該故障解決起來自然也容易多走彎路;為了幫助各位積累這方面故障的經(jīng)驗,本文現(xiàn)在就從實戰(zhàn)角度出發(fā),來向各位還原一則由動態(tài)ARP檢測功能引發(fā)的上網(wǎng)斷斷續(xù)續(xù)故障的排查過程,希望下面的內(nèi)容能起到拋磚引玉的作用!
組網(wǎng)環(huán)境
某單位大樓局域網(wǎng)規(guī)模適中,位于中心機房的核心交換機采用的是H3C品牌的S8500交換機,所有客戶端系統(tǒng)通過超5類網(wǎng)絡(luò)線纜連接到分布在六個樓層中的接入交換機上,接入交換機統(tǒng)一采用2組堆疊的H3C品牌S3050交換機,這些交換機全部位于每個樓層的弱電間中,所有接入交換機全部使用千兆多模光纖與局域網(wǎng)核心交換機相連。為了抑制局域網(wǎng)中的網(wǎng)絡(luò)風暴現(xiàn)象,網(wǎng)絡(luò)管理員特意按照工作部門的不同,將局域網(wǎng)網(wǎng)絡(luò)劃分成12個虛擬工作子網(wǎng),各個虛擬工作子網(wǎng)的網(wǎng)關(guān)全部設(shè)置在局域網(wǎng)核心交換機上;此外,為了提高網(wǎng)絡(luò)管理效率,局域網(wǎng)中還專門架設(shè)了一臺DHCP服務(wù)器,局域網(wǎng)中的每一臺客戶端系統(tǒng)都采用動態(tài)獲取地址方式進行上網(wǎng),平時局域網(wǎng)中的所有系統(tǒng)都能快速、穩(wěn)定地上網(wǎng)訪問。
考慮到最近一段時間ARP病毒比較猖獗,為了保證網(wǎng)絡(luò)能夠始終運行,網(wǎng)絡(luò)管理員在各個接入交換機中分別啟用了防ARP病毒功能。為了配合單位大樓建設(shè)視頻傳輸系統(tǒng)的要求,將位于各個樓層中辦公室內(nèi)的視頻設(shè)備劃分到同一個虛擬工作子網(wǎng)中,并調(diào)整了各個接入交換機的相關(guān)配置,例如統(tǒng)一增加了兩個虛擬工作子網(wǎng)。
故障現(xiàn)象
自從接入交換機被調(diào)整過之后,局域網(wǎng)網(wǎng)絡(luò)運行一直就不穩(wěn)定,許多用戶紛紛打來電話反映情況,說他們的客戶端系統(tǒng)托盤區(qū)域處經(jīng)常彈出網(wǎng)絡(luò)連接受限的提示信息,這個提示說明客戶端系統(tǒng)普遍存在無法從局域網(wǎng)DHCP服務(wù)器那里獲得正確的上網(wǎng)參數(shù)。即使有的客戶端系統(tǒng)能夠勉強上網(wǎng),網(wǎng)絡(luò)連接也是斷斷續(xù)續(xù),使用ping命令測試線路連通性時,發(fā)現(xiàn)網(wǎng)絡(luò)傳輸延遲現(xiàn)象非常的嚴重,而且數(shù)據(jù)丟包率一直很高;由于各個樓層的所有客戶端系統(tǒng)都存在相同的故障現(xiàn)象,筆者下意識以為局域網(wǎng)的核心交換機出現(xiàn)了類似緩存溢出這樣的軟錯誤,于是嘗試著重新啟動了一下核心交換機后臺系統(tǒng),發(fā)現(xiàn)故障現(xiàn)象依然存在。后來,筆者順便重新啟動了一臺普通樓層接入交換機,發(fā)現(xiàn)對應(yīng)交換機下面的客戶端系統(tǒng)在交換機剛剛啟動穩(wěn)定的那一刻,上網(wǎng)速度稍微有點正常,可是沒有多長時間,相同的故障現(xiàn)象又出現(xiàn)了。
排查故障
既然重新啟動樓層接入交換機,可以暫時讓上網(wǎng)速度恢復(fù)正常,那問題看來與樓層接入交換機有關(guān)系。為了能夠探清究竟,筆者立即以系統(tǒng)管理員身份登錄進入其中一個樓層的接入交換機后臺系統(tǒng),使用“dis dia”命令對交換機的各個交換端口進行掃描檢查,看看它們的數(shù)據(jù)流量狀態(tài)是否正常,結(jié)果果然發(fā)現(xiàn)局域網(wǎng)中有廣播數(shù)據(jù)包存在,并且該廣播數(shù)據(jù)包容量在不斷變大,難道是局域網(wǎng)網(wǎng)絡(luò)中存在有網(wǎng)絡(luò)病毒或網(wǎng)絡(luò)環(huán)路現(xiàn)象?為了排除這方面因素的干擾,筆者立即進入流量異常的交換端口視圖模式狀態(tài),在該狀態(tài)下執(zhí)行字符串命令“shutdown”,將數(shù)據(jù)流量不正常的交換端口全部關(guān)閉,可是這樣的努力沒有換來任何效果,顯然上網(wǎng)斷斷續(xù)續(xù)故障與網(wǎng)絡(luò)病毒或網(wǎng)絡(luò)環(huán)路沒有任何關(guān)系。
后來,筆者隨意找了一臺客戶端系統(tǒng),依次單擊“開始”/“運行”命令,在彈出的系統(tǒng)運行對話框中,執(zhí)行ping命令來測試對應(yīng)客戶端系統(tǒng)所在虛擬工作子網(wǎng)的網(wǎng)關(guān)地址,發(fā)現(xiàn)數(shù)據(jù)丟包率達到了驚人的85%,同時數(shù)據(jù)傳輸延遲時間平均達到500ms左右;可是,當筆者嘗試從局域網(wǎng)的核心交換機上,使用ping命令測試Internet網(wǎng)絡(luò)中的某個站點時,發(fā)現(xiàn)這項測試操作一切正常,并且數(shù)據(jù)丟包率僅僅只有1%左右,顯然局域網(wǎng)與Internet網(wǎng)絡(luò)之間的連接是正常的,而問題可能出現(xiàn)在核心交換機與故障客戶端系統(tǒng)之間。
為了能找到具體的故障原因,筆者在局域網(wǎng)的核心交換機后臺系統(tǒng),使用ping命令測試了其中一臺接入交換機的管理IP地址,測試反饋回來的結(jié)果是無法ping通,會不會是核心交換機與樓層接入交換機之間的物理連接存在問題呢?為了排除物理線纜因素,筆者特意找來了專業(yè)的光功率計,來測試連接核心交換機與樓層接入交換機的多模光纖線路連通性,結(jié)果發(fā)現(xiàn)光纖線路具有收發(fā)信號,看來問題還是出在樓層接入交換機上。
不得已,筆者只好再次使用Console控制線纜直接連接到樓層接入交換機上,使用“display interface”命令查看該交換機與核心交換機的級聯(lián)端口狀態(tài),發(fā)現(xiàn)級聯(lián)端口的數(shù)據(jù)流量還是特別大,同時大量的廣播數(shù)據(jù)包依然存在;為了阻止廣播數(shù)據(jù)包影響局域網(wǎng)的穩(wěn)定運行,筆者特意在該接入交換機后臺系統(tǒng),啟用了廣播風暴抑制功能,然而該功能的啟用并沒有帶來任何改變。之后,筆者隨手執(zhí)行了“display cpu”字符串命令,查看了故障交換機的系統(tǒng)資源消耗情況,結(jié)果讓筆者很是吃驚,該交換機的系統(tǒng)CPU資源消耗率竟然達到了驚人的100%,而正常情況下交換機的系統(tǒng)CPU資源消耗率應(yīng)該為25%左右,這也難怪筆者無法從局域網(wǎng)的核心交換機上ping通故障樓層接入交換機。將故障樓層接入交換機與局域網(wǎng)核心交換機之間的物理連接斷開之后,筆者再次執(zhí)行了“display cpu”字符串命令,結(jié)果看到該交換機的CPU資源消耗率迅速下降到30%左右;可是重新連接之后,故障樓層接入交換機的CPU資源消耗率很快又回到了100%,這是什么原因呢?
經(jīng)過仔細分析、對比,筆者認為自從在接入交換機中啟用了防ARP病毒功能后,局域網(wǎng)中才出現(xiàn)了上網(wǎng)不穩(wěn)定的故障現(xiàn)象,會不會是這項功能在暗中“搗亂”呢?為了驗證自己的猜想是否正確,筆者立即將接入交換機的動態(tài)ARP檢測功能給關(guān)閉掉,之后又在對應(yīng)交換機后臺系統(tǒng),使用“display cpu”命令查看了系統(tǒng)CPU資源消耗情況,果然CPU使用率立即從原先的100%下降到30%左右,對應(yīng)交換機下面的客戶端系統(tǒng)上網(wǎng)速度也恢復(fù)了正常。與此同時,另外幾臺暫時沒有關(guān)閉動態(tài)ARP檢測功能的接入交換機,其CPU使用率仍然一直居高不下,并且這些交換機下面的客戶端系統(tǒng)上網(wǎng)速度還是斷斷續(xù)續(xù),數(shù)據(jù)丟包現(xiàn)象仍然十分嚴重。很顯然,局域網(wǎng)中的上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象,與動態(tài)ARP檢測功能有關(guān)。
原因解密
上網(wǎng)搜索了動態(tài)ARP檢測功能的工作原理,筆者發(fā)現(xiàn)該功能會自動截取來自不信任網(wǎng)絡(luò)端口發(fā)送過來的ARP數(shù)據(jù)請求,同時會自動驗證對應(yīng)數(shù)據(jù)包的數(shù)據(jù)綁定行為是否合法,看看它的地址綁定關(guān)系與DHCP綁定表中的是否一致,如果一致的話就對ARP數(shù)據(jù)包進行放行,要是不一致的話就對ARP數(shù)據(jù)包進行丟棄,這項功能可以有效地預(yù)防中間人攻擊,也能防止局域網(wǎng)用戶自行修改網(wǎng)卡物理地址和IP地址,避免局域網(wǎng)中發(fā)生地址沖突現(xiàn)象。經(jīng)過進一步了解,筆者發(fā)現(xiàn)該功能往往與DHCP嗅探功能配合使用,并且該功能還存在一個明顯的缺陷,那就是對ARP數(shù)據(jù)包的動態(tài)檢測操作,需要不停消耗交換機系統(tǒng)的CPU資源,如果處理的ARP數(shù)據(jù)包流量特別大的話,那么交換機系統(tǒng)的CPU資源消耗率就會很高,嚴重時就能出現(xiàn)CPU資源被100%消耗的現(xiàn)象。
而DHCP嗅探功能在工作的時候,DHCP服務(wù)器會將分配出去的動態(tài)IP地址,以及客戶端系統(tǒng)的網(wǎng)卡物理地址之間的對應(yīng)關(guān)系,自動記錄保存到一個地址綁定表中,任何客戶端系統(tǒng)進行網(wǎng)絡(luò)連接的時候,該功能會自動檢查數(shù)據(jù)包的IP地址與網(wǎng)卡物理地址之間的對應(yīng)關(guān)系,看看這種對應(yīng)關(guān)系與地址綁定表中的記錄是否一致,如果一致的話就允許目標數(shù)據(jù)包通過,否則將不允許數(shù)據(jù)包通過,這種功能可以有效地防止局域網(wǎng)其他不合法DHCP服務(wù)器的功能。
當一臺交換機系統(tǒng)同時啟用了動態(tài)ARP檢測功能和DHCP嗅探功能的時候,既能有效防范非法DHCP服務(wù)器的干擾,又能禁止上網(wǎng)用戶隨意改動客戶端系統(tǒng)的上網(wǎng)地址以及網(wǎng)卡物理地址來偷偷上網(wǎng),如此一來就能實現(xiàn)安全、穩(wěn)定相互兼顧的效果;但讓筆者感到非常納悶的是,這里的樓層交換機也是同時啟用了這兩項功能,為什么它們沒有發(fā)揮應(yīng)有的作用呢,反而只有關(guān)閉了動態(tài)ARP檢測功能,才能解決上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象呢?經(jīng)過與集成商的溝通、交流,筆者終于找到了問題的答案,原來當交換機系統(tǒng)同時啟用了上面兩項功能,如果每一臺交換機上都劃分有相同的虛擬工作子網(wǎng)時,那么廣播數(shù)據(jù)包就會在接入交換機之間不停地被發(fā)送或轉(zhuǎn)發(fā),如此一來就會大量消耗交換機系統(tǒng)的CPU資源,最終會引發(fā)上網(wǎng)斷斷續(xù)續(xù)的故障現(xiàn)象。
故障解決
找到故障原因之后,筆者立即重新調(diào)整了各個樓層的接入交換機配置參數(shù),去掉連接視頻傳輸系統(tǒng)的VLAN,并新增加了一臺新交換機,讓所有使用視頻傳輸系統(tǒng)的客戶端系統(tǒng)單獨使用新的交換機進行上網(wǎng),如此一來既能保證原來系統(tǒng)的上網(wǎng)穩(wěn)定,又能方便管理新的視頻傳輸系統(tǒng)。
總結(jié)該故障的排除過程,筆者發(fā)現(xiàn)該故障的發(fā)生純屬巧合,如果不在樓層的接入交換機中同時增加相同的VLAN,或者這些樓層的接入交換機沒有同時啟用動態(tài)ARP檢測功能和DHCP嗅探功能的話,那么這種網(wǎng)絡(luò)掉線的故障就不會發(fā)生。而以往我們在解決網(wǎng)絡(luò)掉線問題的時候,經(jīng)常使用的方法就是先觀察交換機設(shè)備的信號燈狀態(tài)是否正常,如果不正常的話再嘗試重新啟動一下交換機后臺系統(tǒng),相信多數(shù)網(wǎng)絡(luò)故障就能被自動解決了。沒有想到,這次故障的解決費了這么大麻煩!
【推薦閱讀】
◆網(wǎng)管軟件專區(qū)
◆企業(yè)網(wǎng)管員如何監(jiān)控公司網(wǎng)絡(luò)健康運行
◆網(wǎng)管員技巧:網(wǎng)絡(luò)監(jiān)控軟件的部署經(jīng)驗
◆網(wǎng)管軟件的成長之路還有多長
◆IT運維管理專區(qū)
- 1SOA與SaaS 二者將在何處相遇
- 2【職場生存】“上班奴”的心理特征
- 309家電連鎖的良性回歸年
- 4調(diào)查:學(xué)歷提升并未給畢業(yè)生收入帶來明顯優(yōu)勢
- 5優(yōu)秀網(wǎng)站的外部連接標準
- 6中銀絨業(yè)董事長辭職 涉嫌信披違規(guī)被調(diào)查
- 7中小企業(yè)不同成長階段的CRM應(yīng)用模式研究
- 8泛普OA在集團管控下的重點應(yīng)用---管理’復(fù)制’
- 9“企業(yè)信息化從OA開始”這句話深深印在了企業(yè)負責人心中
- 10知名連鎖企業(yè)京客隆的發(fā)展策略
- 11劍橋通用英語五級FCE考試閱讀難句解析
- 12泛普連鎖管理系統(tǒng)助力中國連鎖業(yè)
- 13網(wǎng)管員須知:機房內(nèi)網(wǎng)絡(luò)設(shè)備應(yīng)該如何放置
- 14網(wǎng)管員秘籍:前如何清除路由器設(shè)備內(nèi)部數(shù)據(jù)?
- 15淺談大站合作營銷模式
- 16泛普OA利用專門的工具,可非常方便的進行數(shù)據(jù)的備份和恢復(fù)
- 17OA系統(tǒng)成為企業(yè)用戶日常辦公中的必備工具
- 18全球氣候變暖 馬云稱要殺到“企鵝”家去
- 19實施IT運維管理提高管理效益
- 20四川話搞笑視頻祝大家周末快樂,天天開心
- 21一個工作十年的SEO人35個SEO經(jīng)驗
- 22OA辦公系統(tǒng)的成功上線并不意味著OA實施結(jié)束
- 23調(diào)查研究:喝橙汁對老年人大腦有好處
- 24數(shù)據(jù)集成:讓SOA實現(xiàn)穩(wěn)著陸
- 25氣囊延遲打開 美調(diào)查19.5萬輛日產(chǎn)Rogue
- 26泛普軟件CRM客戶關(guān)系管理軟件是通過對客戶詳細資料的深入分析
- 27OA的發(fā)展可以采取三級火箭的分步發(fā)展方式
- 28華夏優(yōu)職提醒您: 二級建造師講解(五)
- 29中國企業(yè)出路:做龍頭,不做鳳尾
- 30上海公布“12·31”外灘擁擠踩踏事件調(diào)查報告
成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓