監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關閉

中國網(wǎng)通 復雜運維簡單化

申請免費試用、咨詢電話:400-8352-114

文章來源:泛普軟件

箴言

用目標管理激勵人心。?。说?德魯克(Peter F.Drucker)

用對待老鼠的辦法對待知識財富,肯定無法使人的長處得以發(fā)揮。   --弗雷德里克.赫茨伯格(Fredrick Herzberg)

將合適的人請上車,不合適的人請下車。   --管理學者詹姆斯.柯林斯(James C.Collins)

把我們頂尖的20個人才挖走,那么我告訴你,微軟會變成一家無足輕重的公司。    --微軟總裁比爾.蓋茨(Bill Gates)

決策是管理的心臟,管理是由一系列決策組成的,管理就是決策。   --美國著名管理學家赫伯特.西蒙(Herbert A.Simon)

從某種意義上說,融智比融資更重要,財富的生產(chǎn)力比財富本身更重要。   --海爾CEO張瑞敏

一方面,選用優(yōu)良的軟硬件設備;另一方面,用嚴密的規(guī)章制度保障系統(tǒng)正常運轉。大到系統(tǒng)擴容,小到服務器的日常管理工作,網(wǎng)通網(wǎng)管中心都有相應的章程加以規(guī)范。

中國網(wǎng)絡通信集團公司(以下簡稱網(wǎng)通)在原中國電信集團公司及其所屬北方10?。▍^(qū)、市)電信公司、中國網(wǎng)絡通信(控股)有限公司、吉通通信有限責任公司基礎上組建而成。如今,網(wǎng)通不僅是北京2008年奧運會固定通信服務合作伙伴,而且成為國內(nèi)外知名的電信運營商,直接隸屬于集團公司的網(wǎng)管中心,承擔了全網(wǎng)的運維管理工作。

精耕細作的網(wǎng)管中心

與網(wǎng)通主營業(yè)務相對應(包括固定電話、小靈通、ADSL、大客戶專線等通信業(yè)務),網(wǎng)管中心作為一個技術部門,要承擔傳輸網(wǎng)、語音網(wǎng)、數(shù)據(jù)網(wǎng)等網(wǎng)絡的運營維護。其職責涵蓋了網(wǎng)絡的監(jiān)控、設備配置與管理、故障管理等。

復雜的網(wǎng)絡分類,決定了復雜的運維服務工作。網(wǎng)通網(wǎng)管中心組建了13個部門,針對不同專業(yè)的網(wǎng)絡進行分門別類的管理。而黃海康所在的動力維護與系統(tǒng)支撐部,主要是對整個集團公司的網(wǎng)管系統(tǒng)做好運維支撐服務。

據(jù)黃??到榻B,網(wǎng)管系統(tǒng)由各種硬件、軟件、服務器以及不同的操作平臺組成,這些都是系統(tǒng)支撐部的管理范圍。

雖然在購置軟硬件時,廠商會提供一定時期的服務,但是,電信運營的復雜性決定了一個廠商不可能做所有系統(tǒng)。網(wǎng)通的網(wǎng)管系統(tǒng)至今仍是分散的,細分為IP性能分析系統(tǒng)、語音網(wǎng)管理系統(tǒng)、傳輸網(wǎng)管理系統(tǒng)等。因此,管理這些網(wǎng)管系統(tǒng)本身就是一件復雜的工作。

對于黃海康和同事來說,最重要的工作是對海量存儲系統(tǒng)、投影系統(tǒng)以及服務器/主機系統(tǒng)的運營維護和管理。

海量存儲系統(tǒng)是所有網(wǎng)絡運維部門共享的一個系統(tǒng),而不屬于某一個部門,語音網(wǎng)可以用,傳輸網(wǎng)也可以用。之所以稱為“海量”,是因為它有幾個TB的容量,并且運轉在光接口上。系統(tǒng)支撐部根據(jù)每個部門的要求,分配海量存儲系統(tǒng)的空間,并對模塊系統(tǒng)進行管理,保證系統(tǒng)的正常運轉。

投影系統(tǒng)是網(wǎng)管中心指揮調(diào)度的一個輔助系統(tǒng),它顯示各種流量和數(shù)據(jù),便于相互協(xié)調(diào)。這也需要系統(tǒng)支撐部的分配。

服務器/主機有web服務器、DNS、郵件服務器等,對網(wǎng)絡提供不同的服務,它們更是需要長期的維護。

對網(wǎng)管系統(tǒng)的日常監(jiān)控、配置和管理成為系統(tǒng)支撐部最重要的日常工作,保障網(wǎng)管系統(tǒng)的正常運轉,不出故障,也是系統(tǒng)支撐部最大的理想。因為,一旦系統(tǒng)宕機,數(shù)據(jù)可能丟失,對業(yè)務影響非常大,甚至造成無法挽回的損失。

每天的“作業(yè)”與每月的“功課”

嚴密的規(guī)章制度是網(wǎng)通運維管理中的一項重要內(nèi)容。大到系統(tǒng)擴容,小到一個U盤的發(fā)放工作,都有相應的章程加以規(guī)范。

“一方面,我們選用優(yōu)良的軟硬件設備;另一方面,我們用嚴密的規(guī)章制度保障系統(tǒng)正常運轉。”黃??到榻B說。網(wǎng)管大廳、機房設備等運維管理,網(wǎng)管人員都有章可循,有規(guī)可依。

就拿服務器/主機的維護來說,說簡單也很簡單,網(wǎng)管人員“少操作甚至不操作”也能運轉,因為很多故障都是人為操作造成的。但是,要真正管好,網(wǎng)管人員卻有很多的“功課”要做。網(wǎng)通就對服務器/主機的運維管理制定了“維護作業(yè)規(guī)程”。

“維護作業(yè)規(guī)程”規(guī)定了網(wǎng)管人員每天要做的作業(yè)和每月必修的功課。記錄CPU使用率、刪除無用文件以釋放磁盤空間、檢查當前運行的服務進程、病毒碼是否最新、系統(tǒng)補丁是否更新、機器指示燈是否完好、網(wǎng)絡是否連通等,都是網(wǎng)管人員每天必須要做的。

每月要做的事情有檢查電源、電纜是否牢固,標簽是否完好,數(shù)據(jù)備份等。

雖然這些事看起來小,卻必不可少。比如設備標簽,它包含很多信息量,有序列號、所屬部門、購置時間、責任人、用途、配置以及IP地址等。標簽有無與新舊,不僅影響財務部門的資產(chǎn)審計,而且影響其他網(wǎng)管人員對該機器的維護。

系統(tǒng)支撐部承擔了相關規(guī)章的制定工作。服務器分布在各個專業(yè)部門,系統(tǒng)支撐部就要下發(fā)服務器的維護作業(yè)規(guī)程,并督促各部門落到實處。如果沒有一天一天的積累,等大的問題發(fā)現(xiàn)時,可能補救都來不及了。

擴容

長期而細致的維護工作中,網(wǎng)管員可能會發(fā)現(xiàn)某臺服務器響應速度越來越慢,或者磁盤空間越來越小等狀況?這是網(wǎng)管中心系統(tǒng)支撐部在日常維護管理工作中遇到的另一個問題?現(xiàn)有設備或系統(tǒng)不能滿足業(yè)務的需求。

在這種情況下,系統(tǒng)有兩種選擇:擴容和替換?;诔杀镜目紤],網(wǎng)管中心首先會選擇擴容。費用較高的大型設備的擴容,一般由設計院來研究決定;小型設備如服務器等則由網(wǎng)管中心申請、測試和實施,如服務器的擴容。

黃??稻徒?jīng)歷過一臺服務器的擴容。那是一臺提供認證服務的服務器,在用戶撥號上網(wǎng)時,輸入賬號和密碼,經(jīng)服務器驗證后給用戶授權。

但是服務器使用年限一長,性能明顯落后,直接影響接通效率。服務器對用戶請求應接不暇,發(fā)展到后來只有少量用戶能夠連上。

網(wǎng)管中心首先想到了給這臺服務器擴容:從單個CPU增加到雙個CPU,內(nèi)存從512兆增加到1G。他們選擇了凌晨3點左右(此時流量少,影響也最小)實施,拆開服務器,插入一個模塊,然后重啟,看服務器能否識別新硬件,功能是否正常。如果不識別,則分析原因,比如是否軟件也要升級才能識別硬件。

當然網(wǎng)管人員做好了功能不正常的準備,在計劃的時間沒有辦法解決故障,他們就會拆掉新加的模塊,恢復原狀,然后再試。

事實上,他們只用了一個小時就成功實施了服務器的擴容。

切換

經(jīng)過擴容的認證服務器在使用半年之后,又產(chǎn)生了同樣的問題??它仍然滿足不了業(yè)務增長的需求。但是服務器滿配就是2個CPU,已經(jīng)不能再擴容。此時,網(wǎng)管中心需要用一個全新的機器來代替它。

用一個新機器來代替在線使用的設備,即新舊設備的切換,這需要測試。網(wǎng)管中心安裝新系統(tǒng)之前要做好測試工作,或者人工模擬用戶使用狀況,或者采用測試系統(tǒng)。網(wǎng)通新系統(tǒng)的測試一般都有計劃書,按照計劃一步一步去測。

比如一個步驟要測試5遍,每一遍的測試數(shù)據(jù)都要記錄下來,包括出現(xiàn)的故障,以及解決方法等。同時,要根據(jù)系統(tǒng)的復雜程度決定切換時間,短的半天,長的一周,甚至半年。但電信企業(yè)要求不長于3小時。

系統(tǒng)或設備切換必然涉及到服務中斷,因此也要選擇恰當?shù)臅r機。在服務器斷電后,將其移出機柜,新的機器接通電纜,然后檢查新機器以及相關設備是否運轉正常,只有恢復到割接之前的狀態(tài)才算正常。

但是,擴容還是切換新系統(tǒng),并不是短視行為,而要長期規(guī)劃。它不僅取決于硬件系統(tǒng)的性能,更重要的是與業(yè)務部門的需求相匹配。

如果系統(tǒng)所提供的服務,是增長快、市場潛力大的業(yè)務,則會考慮未來需求進行擴容或更換新系統(tǒng)。相反,如果系統(tǒng)所服務的業(yè)務,增長量已經(jīng)達到高峰,或者呈下降的趨勢,則不會考慮擴容。網(wǎng)管部門和市場部門分別提出建議,領導根據(jù)雙方的情況決定是否擴容。

鏈接

數(shù)據(jù)通信維護規(guī)程(部分)

數(shù)據(jù)通信網(wǎng)絡業(yè)務數(shù)據(jù)和軟件的維護管理

1.維護項目及維護周期

(1)定期檢查和清理網(wǎng)絡業(yè)務數(shù)據(jù)(每月);

(2)網(wǎng)絡局數(shù)據(jù)的增、刪、改(實時);

(3)用戶數(shù)據(jù)的增、刪、改(實時);

(4)軟件備份(必要時);

(5)軟件升級(必要時)。

2.維護要求

(1)網(wǎng)絡業(yè)務數(shù)據(jù)應根據(jù)需要定期按時備份,并注意保存?zhèn)浞萁Y果;

(2)新版本業(yè)務數(shù)據(jù)產(chǎn)生后應先進行測試,再避開忙時加載使用,并作記錄;

(3)所有設備在作配置修改前后應及時備份。備份結果保留到下一次;

(4)軟件維護要做到

①軟件維護須由專人負責,并嚴格做好日常維護工作;

②必須嚴格執(zhí)行各類軟件維護制度,并制定軟件維護工作計劃;

③軟件版本更新(升級)、軟件的修改必須遵守先審批后執(zhí)行的原則;

④不得進行正常軟件維護工作以外的操作。

數(shù)據(jù)通信系統(tǒng)網(wǎng)管設備的維護

1.日常維護項目和要求

觀察網(wǎng)管系統(tǒng)各部分的運行狀態(tài),包括:

(1)CPU負荷

(2)磁盤狀態(tài)

(3)文件系統(tǒng)

(4)存儲空間

(5)打印機

(6)通信接口

(7)控制臺終端

2.年檢維護項目和要求

利用系統(tǒng)提供的診斷測試程序,每年進行一次全面的系統(tǒng)診斷測試,項目包括:

(1)CPU

(2)內(nèi)存儲器

(3)磁盤

(4)光盤機

(5)磁帶機

(6)打印機

(7)通信接口

(8)顯示器

(9)路由器

(10)局域網(wǎng)接口

發(fā)布:2007-04-21 10:17    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]
相關文章:
產(chǎn)品介紹
聯(lián)系方式

成都公司:成都市成華區(qū)建設南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢