監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

兩招解決IT運(yùn)維日志管理難題

申請免費(fèi)試用、咨詢電話:400-8352-114

長久以來,日志管理都是上網(wǎng)行為運(yùn)維工程師不可回避的工作,它不但可以跟蹤上網(wǎng)行為基礎(chǔ)設(shè)施活動,更是回答故障是否發(fā)生、如何發(fā)生、何時(shí)發(fā)生、在何處發(fā)生的最佳答案。但不斷增加的設(shè)備與網(wǎng)絡(luò)行為產(chǎn)生了令人難以控制的海量日志,告警信息更是成百上千,而僅憑人工進(jìn)行管理,幾乎成了一件不可能完成的任務(wù)。

日志監(jiān)控也有“狼來了”

考慮到日志管理本身所具有的功效,收集日志數(shù)據(jù)及進(jìn)行分析,通常被認(rèn)為是上網(wǎng)行為運(yùn)維最具常態(tài)的工作之一,更是防禍于未然的有效手段。但這種常態(tài)任務(wù)一旦超出工作負(fù)荷,不但在“量”上面無法完成,還很有可能在“質(zhì)”上影響上網(wǎng)行為運(yùn)維管理的有效性。

趙蒙,某市信息網(wǎng)絡(luò)中心的運(yùn)維工程師,雖說頭頂著上網(wǎng)行為光環(huán),但他卻備受日志監(jiān)控的煎熬,過著“苦行僧”一般的生活。網(wǎng)絡(luò)中心不但要負(fù)責(zé)電子政務(wù)數(shù)十個(gè)業(yè)務(wù)系統(tǒng)的運(yùn)維保障,還兼管其他委辦局業(yè)務(wù)系統(tǒng)監(jiān)控的工作,不論白班或是夜班值守的同事,所有人都有一項(xiàng)工作必不可少,這就是“檢查日志、評估和處理告警事件”。為了提高工作效率,在大家群策群力之下,許多針對操作系統(tǒng)或者是數(shù)據(jù)庫日志系統(tǒng)的自動處理腳本被一一開發(fā)出來。但這并沒有讓運(yùn)維監(jiān)控壓力得到緩解,網(wǎng)絡(luò)設(shè)備、服務(wù)器、網(wǎng)絡(luò)流量,甚至數(shù)據(jù)庫的警告信息,成千條日志信息堆積在一起更本沒法判斷問題的根源在哪里?在這種情形下,趙蒙漸漸疲態(tài)化,放棄了努力,每次在巡檢表格上胡亂填上幾筆,草草了事。

針對上網(wǎng)行為運(yùn)維管理人員這種常態(tài)化的工作方式,泛普軟件認(rèn)為:“管理人員如果每天只能按部就班的面對每一臺服務(wù)器、網(wǎng)絡(luò)設(shè)備,逐個(gè)去檢查它們的狀況,或者從幾千條日志中找到有價(jià)值的內(nèi)容,確實(shí)需要耐心、細(xì)心和責(zé)任心。但由于工作量巨大,很多時(shí)候人們開始習(xí)慣“狼來了”的心態(tài)。此時(shí),如果沒有對某條告警日志背后的隱患徹底查驗(yàn),看似正常的業(yè)務(wù)系統(tǒng)則可能由此轟然倒塌。但是,借助泛普軟件智能化的運(yùn)維平臺,則可以實(shí)現(xiàn)自動處理海量日志、主動挖掘故障線索,不喊“狼來了”,即使“狼”真的來了也不懼怕。“

“兩招”化解日志管理難題

日志用來記錄用戶操作、系統(tǒng)運(yùn)行狀態(tài),是一個(gè)運(yùn)維系統(tǒng)中重要的核心部分,它直接關(guān)系到系統(tǒng)出現(xiàn)問題時(shí)定位的速度。對日志的觀察和分析,能提前發(fā)現(xiàn)系統(tǒng)可能的風(fēng)險(xiǎn),避免線上事故的發(fā)生。為了幫助趙蒙早日摘掉“日志控”的帽子,泛普軟件運(yùn)維管理專家傳授他“兩招”最實(shí)用的方法,這就是日志管理中的“廣度、深度”。

第一招:用“廣度”拒絕漏網(wǎng)之魚

日志范圍夠不夠廣,是拒絕漏網(wǎng)之魚,走出成功的第一步。為此,趙蒙可以借助泛普BTIM 上網(wǎng)行為綜合管理平臺,將網(wǎng)絡(luò)、安全、機(jī)房、桌面、服務(wù)器、數(shù)據(jù)庫、中間件、應(yīng)用、業(yè)務(wù)等各個(gè)方面監(jiān)控起來,對所有設(shè)備的性能、各類數(shù)據(jù)流進(jìn)行自動采集。隨后,他可以使用批量告警設(shè)置功能,進(jìn)而屏蔽差異項(xiàng),在縮短告警規(guī)則設(shè)置時(shí)間的同時(shí),從上百條告警規(guī)則中解脫出來,只維護(hù)十分之一的告警規(guī)則,大幅降低了告警規(guī)則維護(hù)的復(fù)雜度。

第二招:用“深度”追擊故障根源

日志管理不能是孤立的,否則它在主動運(yùn)維方式中就沒有任何意義。為此,泛普BTIM包含了強(qiáng)大的信息關(guān)聯(lián)展示、分析能力,管理人員可以在業(yè)務(wù)管理上綜合不同領(lǐng)域的業(yè)務(wù)相關(guān)“關(guān)鍵參數(shù)”,判斷具體故障性質(zhì)、位置,直接調(diào)用各個(gè)管理組件定位故障點(diǎn)。一旦發(fā)現(xiàn)危險(xiǎn)事件,TFS管理系統(tǒng)將可以依據(jù)業(yè)務(wù)實(shí)際流量路徑,按照分析需要,逐層擴(kuò)大數(shù)據(jù)采集的深度和廣度,層層深入,直達(dá)故障根源。

事件監(jiān)控、日志分析,這些上網(wǎng)行為運(yùn)維管理中的“自動化”,談起來容易,真正實(shí)現(xiàn)卻并不簡單。實(shí)際上,整個(gè)上網(wǎng)行為基礎(chǔ)架構(gòu),有很多不同的組成部分構(gòu)成,有很多不同的信息,而自動化也是上網(wǎng)行為運(yùn)維管理逐步發(fā)展演進(jìn)的過程。從趙蒙帶領(lǐng)大家編寫自動處理腳步,到對整個(gè)上網(wǎng)行為管理作業(yè)流的自動控制,這些技術(shù)上的改變都是在追求著:實(shí)現(xiàn)智能化的運(yùn)維,解放人力!

在本案例中,看似只在日志管理上前進(jìn)了一小步,但恰恰反映出運(yùn)維體系向著成熟邁出了一大步,擺脫這種低水平的循環(huán),將使得上網(wǎng)行為 運(yùn)營更加高效,讓時(shí)間變得更有價(jià)值。以趙蒙為代表的運(yùn)維工程師們,從此更可以不再千篇一律,“狼來了”的故事也不再有人提起。

【推薦閱讀】

上網(wǎng)行為運(yùn)維管理專區(qū)

上網(wǎng)行為運(yùn)維管理者如何在DT時(shí)代玩轉(zhuǎn)數(shù)據(jù)分析

如何完成遠(yuǎn)程排除網(wǎng)絡(luò)故障

孫永杰:本土軟件企業(yè)的對手不是“老外”

網(wǎng)管軟件專區(qū)

本文來自互聯(lián)網(wǎng),僅供參考
發(fā)布:2007-04-15 10:00    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
相關(guān)軟件
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢