監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關(guān)閉

網(wǎng)絡(luò)管理員如何解決上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象

申請免費試用、咨詢電話:400-8352-114

局域網(wǎng)網(wǎng)絡(luò)使用起來很方便,但管理起來卻不是一件容易的事情,單單用戶不同的上網(wǎng)需求,就能讓網(wǎng)絡(luò)管理員忙得不亦樂乎,更不用說頻繁出現(xiàn)的各種網(wǎng)絡(luò)故障了。這不,上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象十分常見,引起該故障的因素也是復(fù)雜、多變,該故障解決起來自然也容易多走彎路;為了幫助各位積累這方面故障的經(jīng)驗,本文現(xiàn)在就從實戰(zhàn)角度出發(fā),來向各位還原一則由動態(tài)ARP檢測功能引發(fā)的上網(wǎng)斷斷續(xù)續(xù)故障的排查過程,希望下面的內(nèi)容能起到拋磚引玉的作用!


  組網(wǎng)環(huán)境


  某單位大樓局域網(wǎng)規(guī)模適中,位于中心機房的核心交換機采用的是H3C品牌的S8500交換機,所有客戶端系統(tǒng)通過超5類網(wǎng)絡(luò)線纜連接到分布在六個樓層中的接入交換機上,接入交換機統(tǒng)一采用2組堆疊的H3C品牌S3050交換機,這些交換機全部位于每個樓層的弱電間中,所有接入交換機全部使用千兆多模光纖與局域網(wǎng)核心交換機相連。為了抑制局域網(wǎng)中的網(wǎng)絡(luò)風暴現(xiàn)象,網(wǎng)絡(luò)管理員特意按照工作部門的不同,將局域網(wǎng)網(wǎng)絡(luò)劃分成12個虛擬工作子網(wǎng),各個虛擬工作子網(wǎng)的網(wǎng)關(guān)全部設(shè)置在局域網(wǎng)核心交換機上;此外,為了提高網(wǎng)絡(luò)管理效率,局域網(wǎng)中還專門架設(shè)了一臺DHCP服務(wù)器,局域網(wǎng)中的每一臺客戶端系統(tǒng)都采用動態(tài)獲取地址方式進行上網(wǎng),平時局域網(wǎng)中的所有系統(tǒng)都能快速、穩(wěn)定地上網(wǎng)訪問。


  考慮到最近一段時間ARP病毒比較猖獗,為了保證網(wǎng)絡(luò)能夠始終運行,網(wǎng)絡(luò)管理員在各個接入交換機中分別啟用了防ARP病毒功能。為了配合單位大樓建設(shè)視頻傳輸系統(tǒng)的要求,將位于各個樓層中辦公室內(nèi)的視頻設(shè)備劃分到同一個虛擬工作子網(wǎng)中,并調(diào)整了各個接入交換機的相關(guān)配置,例如統(tǒng)一增加了兩個虛擬工作子網(wǎng)。


  故障現(xiàn)象


  自從接入交換機被調(diào)整過之后,局域網(wǎng)網(wǎng)絡(luò)運行一直就不穩(wěn)定,許多用戶紛紛打來電話反映情況,說他們的客戶端系統(tǒng)托盤區(qū)域處經(jīng)常彈出網(wǎng)絡(luò)連接受限的提示信息,這個提示說明客戶端系統(tǒng)普遍存在無法從局域網(wǎng)DHCP服務(wù)器那里獲得正確的上網(wǎng)參數(shù)。即使有的客戶端系統(tǒng)能夠勉強上網(wǎng),網(wǎng)絡(luò)連接也是斷斷續(xù)續(xù),使用ping命令測試線路連通性時,發(fā)現(xiàn)網(wǎng)絡(luò)傳輸延遲現(xiàn)象非常的嚴重,而且數(shù)據(jù)丟包率一直很高;由于各個樓層的所有客戶端系統(tǒng)都存在相同的故障現(xiàn)象,筆者下意識以為局域網(wǎng)的核心交換機出現(xiàn)了類似緩存溢出這樣的軟錯誤,于是嘗試著重新啟動了一下核心交換機后臺系統(tǒng),發(fā)現(xiàn)故障現(xiàn)象依然存在。后來,筆者順便重新啟動了一臺普通樓層接入交換機,發(fā)現(xiàn)對應(yīng)交換機下面的客戶端系統(tǒng)在交換機剛剛啟動穩(wěn)定的那一刻,上網(wǎng)速度稍微有點正常,可是沒有多長時間,相同的故障現(xiàn)象又出現(xiàn)了。


  排查故障


  既然重新啟動樓層接入交換機,可以暫時讓上網(wǎng)速度恢復(fù)正常,那問題看來與樓層接入交換機有關(guān)系。為了能夠探清究竟,筆者立即以系統(tǒng)管理員身份登錄進入其中一個樓層的接入交換機后臺系統(tǒng),使用“dis dia”命令對交換機的各個交換端口進行掃描檢查,看看它們的數(shù)據(jù)流量狀態(tài)是否正常,結(jié)果果然發(fā)現(xiàn)局域網(wǎng)中有廣播數(shù)據(jù)包存在,并且該廣播數(shù)據(jù)包容量在不斷變大,難道是局域網(wǎng)網(wǎng)絡(luò)中存在有網(wǎng)絡(luò)病毒或網(wǎng)絡(luò)環(huán)路現(xiàn)象?為了排除這方面因素的干擾,筆者立即進入流量異常的交換端口視圖模式狀態(tài),在該狀態(tài)下執(zhí)行字符串命令“shutdown”,將數(shù)據(jù)流量不正常的交換端口全部關(guān)閉,可是這樣的努力沒有換來任何效果,顯然上網(wǎng)斷斷續(xù)續(xù)故障與網(wǎng)絡(luò)病毒或網(wǎng)絡(luò)環(huán)路沒有任何關(guān)系。


  后來,筆者隨意找了一臺客戶端系統(tǒng),依次單擊“開始”/“運行”命令,在彈出的系統(tǒng)運行對話框中,執(zhí)行ping命令來測試對應(yīng)客戶端系統(tǒng)所在虛擬工作子網(wǎng)的網(wǎng)關(guān)地址,發(fā)現(xiàn)數(shù)據(jù)丟包率達到了驚人的85%,同時數(shù)據(jù)傳輸延遲時間平均達到500ms左右;可是,當筆者嘗試從局域網(wǎng)的核心交換機上,使用ping命令測試Internet網(wǎng)絡(luò)中的某個站點時,發(fā)現(xiàn)這項測試操作一切正常,并且數(shù)據(jù)丟包率僅僅只有1%左右,顯然局域網(wǎng)與Internet網(wǎng)絡(luò)之間的連接是正常的,而問題可能出現(xiàn)在核心交換機與故障客戶端系統(tǒng)之間。


  為了能找到具體的故障原因,筆者在局域網(wǎng)的核心交換機后臺系統(tǒng),使用ping命令測試了其中一臺接入交換機的管理IP地址,測試反饋回來的結(jié)果是無法ping通,會不會是核心交換機與樓層接入交換機之間的物理連接存在問題呢?為了排除物理線纜因素,筆者特意找來了專業(yè)的光功率計,來測試連接核心交換機與樓層接入交換機的多模光纖線路連通性,結(jié)果發(fā)現(xiàn)光纖線路具有收發(fā)信號,看來問題還是出在樓層接入交換機上。


  不得已,筆者只好再次使用Console控制線纜直接連接到樓層接入交換機上,使用“display interface”命令查看該交換機與核心交換機的級聯(lián)端口狀態(tài),發(fā)現(xiàn)級聯(lián)端口的數(shù)據(jù)流量還是特別大,同時大量的廣播數(shù)據(jù)包依然存在;為了阻止廣播數(shù)據(jù)包影響局域網(wǎng)的穩(wěn)定運行,筆者特意在該接入交換機后臺系統(tǒng),啟用了廣播風暴抑制功能,然而該功能的啟用并沒有帶來任何改變。之后,筆者隨手執(zhí)行了“display cpu”字符串命令,查看了故障交換機的系統(tǒng)資源消耗情況,結(jié)果讓筆者很是吃驚,該交換機的系統(tǒng)CPU資源消耗率竟然達到了驚人的100%,而正常情況下交換機的系統(tǒng)CPU資源消耗率應(yīng)該為25%左右,這也難怪筆者無法從局域網(wǎng)的核心交換機上ping通故障樓層接入交換機。將故障樓層接入交換機與局域網(wǎng)核心交換機之間的物理連接斷開之后,筆者再次執(zhí)行了“display cpu”字符串命令,結(jié)果看到該交換機的CPU資源消耗率迅速下降到30%左右;可是重新連接之后,故障樓層接入交換機的CPU資源消耗率很快又回到了100%,這是什么原因呢?


  經(jīng)過仔細分析、對比,筆者認為自從在接入交換機中啟用了防ARP病毒功能后,局域網(wǎng)中才出現(xiàn)了上網(wǎng)不穩(wěn)定的故障現(xiàn)象,會不會是這項功能在暗中“搗亂”呢?為了驗證自己的猜想是否正確,筆者立即將接入交換機的動態(tài)ARP檢測功能給關(guān)閉掉,之后又在對應(yīng)交換機后臺系統(tǒng),使用“display cpu”命令查看了系統(tǒng)CPU資源消耗情況,果然CPU使用率立即從原先的100%下降到30%左右,對應(yīng)交換機下面的客戶端系統(tǒng)上網(wǎng)速度也恢復(fù)了正常。與此同時,另外幾臺暫時沒有關(guān)閉動態(tài)ARP檢測功能的接入交換機,其CPU使用率仍然一直居高不下,并且這些交換機下面的客戶端系統(tǒng)上網(wǎng)速度還是斷斷續(xù)續(xù),數(shù)據(jù)丟包現(xiàn)象仍然十分嚴重。很顯然,局域網(wǎng)中的上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象,與動態(tài)ARP檢測功能有關(guān)。


  原因解密


  上網(wǎng)搜索了動態(tài)ARP檢測功能的工作原理,筆者發(fā)現(xiàn)該功能會自動截取來自不信任網(wǎng)絡(luò)端口發(fā)送過來的ARP數(shù)據(jù)請求,同時會自動驗證對應(yīng)數(shù)據(jù)包的數(shù)據(jù)綁定行為是否合法,看看它的地址綁定關(guān)系與DHCP綁定表中的是否一致,如果一致的話就對ARP數(shù)據(jù)包進行放行,要是不一致的話就對ARP數(shù)據(jù)包進行丟棄,這項功能可以有效地預(yù)防中間人攻擊,也能防止局域網(wǎng)用戶自行修改網(wǎng)卡物理地址和IP地址,避免局域網(wǎng)中發(fā)生地址沖突現(xiàn)象。經(jīng)過進一步了解,筆者發(fā)現(xiàn)該功能往往與DHCP嗅探功能配合使用,并且該功能還存在一個明顯的缺陷,那就是對ARP數(shù)據(jù)包的動態(tài)檢測操作,需要不停消耗交換機系統(tǒng)的CPU資源,如果處理的ARP數(shù)據(jù)包流量特別大的話,那么交換機系統(tǒng)的CPU資源消耗率就會很高,嚴重時就能出現(xiàn)CPU資源被100%消耗的現(xiàn)象。


  而DHCP嗅探功能在工作的時候,DHCP服務(wù)器會將分配出去的動態(tài)IP地址,以及客戶端系統(tǒng)的網(wǎng)卡物理地址之間的對應(yīng)關(guān)系,自動記錄保存到一個地址綁定表中,任何客戶端系統(tǒng)進行網(wǎng)絡(luò)連接的時候,該功能會自動檢查數(shù)據(jù)包的IP地址與網(wǎng)卡物理地址之間的對應(yīng)關(guān)系,看看這種對應(yīng)關(guān)系與地址綁定表中的記錄是否一致,如果一致的話就允許目標數(shù)據(jù)包通過,否則將不允許數(shù)據(jù)包通過,這種功能可以有效地防止局域網(wǎng)其他不合法DHCP服務(wù)器的功能。


  當一臺交換機系統(tǒng)同時啟用了動態(tài)ARP檢測功能和DHCP嗅探功能的時候,既能有效防范非法DHCP服務(wù)器的干擾,又能禁止上網(wǎng)用戶隨意改動客戶端系統(tǒng)的上網(wǎng)地址以及網(wǎng)卡物理地址來偷偷上網(wǎng),如此一來就能實現(xiàn)安全、穩(wěn)定相互兼顧的效果;但讓筆者感到非常納悶的是,這里的樓層交換機也是同時啟用了這兩項功能,為什么它們沒有發(fā)揮應(yīng)有的作用呢,反而只有關(guān)閉了動態(tài)ARP檢測功能,才能解決上網(wǎng)斷斷續(xù)續(xù)故障現(xiàn)象呢?經(jīng)過與集成商的溝通、交流,筆者終于找到了問題的答案,原來當交換機系統(tǒng)同時啟用了上面兩項功能,如果每一臺交換機上都劃分有相同的虛擬工作子網(wǎng)時,那么廣播數(shù)據(jù)包就會在接入交換機之間不停地被發(fā)送或轉(zhuǎn)發(fā),如此一來就會大量消耗交換機系統(tǒng)的CPU資源,最終會引發(fā)上網(wǎng)斷斷續(xù)續(xù)的故障現(xiàn)象。


  故障解決


  找到故障原因之后,筆者立即重新調(diào)整了各個樓層的接入交換機配置參數(shù),去掉連接視頻傳輸系統(tǒng)的VLAN,并新增加了一臺新交換機,讓所有使用視頻傳輸系統(tǒng)的客戶端系統(tǒng)單獨使用新的交換機進行上網(wǎng),如此一來既能保證原來系統(tǒng)的上網(wǎng)穩(wěn)定,又能方便管理新的視頻傳輸系統(tǒng)。


  總結(jié)該故障的排除過程,筆者發(fā)現(xiàn)該故障的發(fā)生純屬巧合,如果不在樓層的接入交換機中同時增加相同的VLAN,或者這些樓層的接入交換機沒有同時啟用動態(tài)ARP檢測功能和DHCP嗅探功能的話,那么這種網(wǎng)絡(luò)掉線的故障就不會發(fā)生。而以往我們在解決網(wǎng)絡(luò)掉線問題的時候,經(jīng)常使用的方法就是先觀察交換機設(shè)備的信號燈狀態(tài)是否正常,如果不正常的話再嘗試重新啟動一下交換機后臺系統(tǒng),相信多數(shù)網(wǎng)絡(luò)故障就能被自動解決了。沒有想到,這次故障的解決費了這么大麻煩!

【推薦閱讀】

網(wǎng)管軟件專區(qū) 

企業(yè)網(wǎng)管員如何監(jiān)控公司網(wǎng)絡(luò)健康運行

網(wǎng)管員技巧:網(wǎng)絡(luò)監(jiān)控軟件的部署經(jīng)驗

網(wǎng)管軟件的成長之路還有多長

IT運維管理專區(qū)

本文來自互聯(lián)網(wǎng),僅供參考
發(fā)布:2007-04-16 09:44    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普泛普博客其他應(yīng)用

泛普OA商務(wù)合同 泛普OA需求調(diào)研 泛普OA實施方案 泛普OA項目啟動 泛普網(wǎng)絡(luò)硬件配置 泛普OA部署安裝 泛普流程模板表單 OA系統(tǒng)二次開發(fā) 泛普常見問題解決 泛普OA操作手冊 泛普軟件項目驗收 泛普培訓(xùn)推廣上線 泛普OA售后服務(wù) 泛普新聞 泛普期刊 泛普博客