當前位置:工程項目OA系統(tǒng) > 泛普各地 > 江西OA系統(tǒng) > 南昌OA系統(tǒng) > 南昌OA信息化
營造播存網格
■ 關于“互聯網本質”的討論,已成為跨越科技、經濟、政治、社會乃至諸多邊緣科學領域的熱點話題。各種學術研討、科技論壇、技術研發(fā),乃至科幻電影,都圍繞著互聯網做了大量熱烈的討論。
■ 最近一段時間,中國工程院院士李幼平關于“互聯網的無尺度現象”的學術觀點,在業(yè)界產生了廣泛影響。立足于現象,發(fā)掘其成因、規(guī)律,并通過可計算的數學邏輯,對互聯網進行客觀分析,在此基礎上,李幼平提出:互聯網是一個無尺度分布和隨機分布并存的網絡!
■ 并且,他在此基礎上闡述了互聯網次級結構——播存網格的概念、結構和示例,以幫助克服現有互聯網的數字鴻溝,為營造“存文化于民間”的環(huán)境、實現信息共享的歷史性跨躍,提供了一種新思路。
■ 更進一步,李幼平院士據此提出雙結構互聯網的思想、概念和框架結構。
■ 《計算機世界》近日特約李幼平院士就其研究方向為本報撰稿,以使讀者能夠深入淺出地了解紛亂互聯網背后所隱藏的本質,以及互聯網的未來發(fā)展方向。
近年來的科學實驗發(fā)現,萬維網網頁的連接數服從冪次律分布,互聯網也因此成為無尺度網絡。普通網民對互聯網的訪問具有明顯的“群聚”特征,大多數網民的訪問對象集中于為數不多的網站,因此,只需把數千個熱門網站整合起來,就可以形成滿足絕大多數人日常需求的主流資源。
我們提議,互聯網在保留TCP/IP主體結構的基礎上,增添一種“衛(wèi)星廣播和分布存儲”的“播存結構”作為次級結構。通過次級結構廣泛復制數千個網站的內容,讓每一棟大樓與每一個自然村都擁有主流文化資源,營造“存文化于民間”的全國環(huán)境,實現信息共享的歷史性跨躍。如圖1所示。
圖1 雙結構互聯網示意圖
用“透明計算”模式整合互聯網的主、次兩級結構,用戶只需提出內容需求,網頁將自動以最低成本的方式到達用戶端,用戶無需感知網頁是來自何種網絡。這一思路將有助于創(chuàng)造類似于水電服務那樣簡便的信息共享服務。
1 互聯網中的無尺度現象
互聯網是20世紀人類最偉大的發(fā)明之一,自1969年Internet的前身ARPANET誕生以來,計算機網絡技術飛速發(fā)展。以TCP/IP協(xié)議為核心的網絡互聯技術實現了計算機硬件的連通,形成了全球范圍內計算機互聯的基礎設施,即Internet。在此基礎上,以HTTP、HTML和URL為核心的Web技術,實現了信息資源的互聯,使Internet進一步演變成全球性共享文化的巨大平臺。
圖2 互聯網的三個發(fā)展階段
從互聯網普及的角度考察互聯網的發(fā)展階段,可以將其劃分為Net、Web和Grid三個時代。如圖2所示,其中橫坐標代表時間軸,縱坐標p為普及指數(pervasive index),代表參加聯網的計算機總數與人口總數之比。
在互聯網誕生初期的Net時期,網絡僅僅作為科學家之間的一種聯絡工具,聯系數量不多的計算機。這個時期平均每一萬人才有一臺計算機,p值小于萬分之一。
20世紀90年代之后,Web的應用開始了網絡的公眾認可期,WWW作為搜尋信息的文化工具,采用一對多的Client/Server結構,p值躍升到0.01至0.1。
進入21世紀以來,互聯網正在進入廣泛應用計算機的網格(Grid)時代,網格所追求的目標是全部的人通過計算機共享信息,采用pervasive/Grid結構,計算機成為一種遍及化的工具,聯網的計算機總數將接近甚至超過人口總數,p接近或超過1。
從以上分析可以看出,互聯網正在朝著“普適化”(pervasive)方向發(fā)展。普適化既深刻影響著人類的文化活動,又使得人類的文化活動滲入互聯網的發(fā)展過程中,使得互聯網的發(fā)展脫離了純粹的技術范疇。也就是說,人類的文化活動隨著其與互聯網的深入結合又反過來深刻地影響著互聯網的發(fā)展,包括互聯網發(fā)展階段的劃分、互聯網的主流技術,甚至是互聯網的網絡結構。
互聯網演化為無尺度網絡
最近幾年,美國科學家A.L.Barabasi等人用統(tǒng)計物理學的實驗方法發(fā)現,文化活動悄悄改變著網絡運作的數學模型,由原先正態(tài)分布的隨機模型轉變?yōu)閮绱畏植嫉臒o尺度(scale-free)模型。
“無尺度”是什么意思?理論家把龐大復雜的網絡,分解為“節(jié)點”(node)和“連接”(link)兩大要素; 提供內容的網站和接受內容的網民統(tǒng)稱為“節(jié)點”,而內容在節(jié)點間的運動稱為“連接”。一個網站的社會作用或文化地位,可以用該網站與外界的連接數來衡量。如果某個網站很長時間也沒有人來連接,表明網站的社會影響不大,文化地位不高; 反過來,如果連接頻繁,作用就大,地位就高。
網民對網站的訪問,可以說是獨立、自由的,完全取決于網民本人的主觀意愿。在做大量統(tǒng)計實驗之前,科學家預測,連接數應當服從泊松分布或正態(tài)分布,即每個網站的被訪問量差異不會太大,就像人類身高差異不會太大那樣。然而,實測結果推翻了這個預測。Barabasi等人設計了一種軟件,可以從一個節(jié)點跳到另一節(jié)點,收集并記錄網上的所有連接。在對幾十萬個節(jié)點進行統(tǒng)計之后,他們獲得了令人驚異的結果: 當絕大多數網站的連接數很少的情況下,卻有極少數網站擁有高于普通網站百倍、千倍甚至萬倍的連接數。
這就像在茫茫人海中突然發(fā)現若干身高數百米巨人一樣令人吃驚。巨人的身高之大,已不能用普通人高度的尺度來度量,于是“無尺度”一詞被應用,以形容少數節(jié)點連接數大大超出普通節(jié)點的現象。
盡管萬維網(WWW)中能夠提供內容的網站很多,網頁量更是天文數字,但是,有能力長時間吸引眾多網民大量訪問的網站,卻為數非常有限,使用連接數作為判斷依據,可以把少數對社會貢獻特別大的熱門網站從信息海洋中分離出來。
我們在實際網絡中看到的現象正是如此。盡管中國境內向網民提供內容的網站多達67萬個,但是,其中只有為數不多的網站,才擁有網民感覺豐富無窮盡的大量內容,具有接納足夠多人同時訪問的高帶寬,有條件演化成熱門網站,我們把這些擁有大連接數的熱門網站稱之為互聯網中的集散節(jié)點。就目前來看,互聯網中的集散節(jié)點除了新浪、Google、Yahoo等門戶網站外,就是己經上網的報紙、期刊、通訊社、電臺之類的專業(yè)“網絡傳媒”。
在某種意義上,正是這些集散節(jié)點的客觀存在,影響了網絡運作的數學模型,使得互聯網從早期的隨機網絡演變?yōu)槟壳暗臒o尺度網絡。
無尺度現象的成因
無尺度現象的成因,可以從多個角度解釋。Barabasi等人解釋,優(yōu)先連接性和網絡的成長性是兩個起因。
所謂成長性指網民網頁都急劇增加; 優(yōu)先連接性指新網民總是優(yōu)先選擇前人經常訪問的網站,隨著時間的推進,某些熱門的網站愈加熱門,不知名的網站受訪問的機會越少。計算機仿真可以演示出:萬維網如何由相對均衡分布的隨機網絡逐漸演化為極不均衡分布的無尺度網絡。
哲學家解釋這一現象時認為: 存在決定意識。某人選擇連接某一網站,雖然是一種個人意識。但人類生活在同一地球上,相同或者相似的客觀境遇,使得人群中有相同或相似的個人意識。大量的統(tǒng)計,把深藏于個性中的共性強烈地反應出來了。充分的自由民主,在一定條件下,有可能轉化為高度的集中統(tǒng)一,這是“對立統(tǒng)一”的例證。以DNA為例,DNA雖然是個性標志,但人與人之間的碼元99%以上是相同的,說明個性中潛在存有共性。
無尺度現象給信息科技工作者帶來很多啟示。它首先讓大家認識到: 信息社會同時兼有“大世界”與“小世界”兩種屬性。一方面,網民、網頁、帶寬隨時間快速成長,使得萬維網成為名副其實的全球范圍內的巨大網絡(World Wide Web); 另一方面,每個人一天之內所能接受的信息,受到生理帶寬與生理精力的限制,又是一個不隨時間變化的小世界。大世界與小世界之間,技術世界同“以人為本”的人文世界之間,存在明顯的差異與矛盾,而這一矛盾的主要方面在用戶端。
用戶感覺到,數十萬網站和數百億網頁,猶如“信息孤島”,實在難以分別直接面對。他們希望出現一種能承大啟小的“中間代理”,使用戶很容易對這個統(tǒng)一的中間代理表達自己的需求,有興趣的內容又會通過中間代理主動地流入自己的家中?!爸虚g代理”是什么?它正是無尺度現象所指出的、由熱門網站構成的群體。由數百或數千資源構成的熱門群體,是網民通過民主的方法由大家“選舉”出來的,是人類文明進程的自然產物,值得我們倍加珍惜。
如何整合資源
中國工程院最近組織的“信息基礎設施和資源共享”發(fā)展戰(zhàn)略研究論壇上,李國杰院士指出“信息取精是關鍵”,李德毅院士也認為,當前的迫切目標是讓“適當的人在適當的時候享用適當的信息”。
無尺度現象告訴我們,要求所有的人享用所有信息,既不可能,也沒有必要。關鍵問題是,如何“取精”?對絕大多數普通用戶而言,什么是他們日常最適當的信息資源?這兩個問題必須用科學統(tǒng)計的結果來回答??梢韵馟oogle的Page Rank軟件那樣,把網民對網頁的訪問數,看成是網民對資源的“民主投票”的結果,以這個數據作基礎,判斷該信息資源對推動社會進步所可能做出的貢獻,決定它是不是屬于“主流資源”,可否成為我們整合的對象。
也就是說,借助冪次定律作為工具,把茫茫無邊的信息資源一分為二,把滿足廣大人民日常需求的主流資源,甄別出來,整合起來。由此,必須首先回答,中國互聯網信息資源連接數,服從什么樣的冪次分布。中國工程物理研究院馬衛(wèi)東等幾位年青人,根據中國互聯網中心CNNIC發(fā)表的實測數據,初步描繪了我國萬維網網站連接數的數學模型(這一過程中利用了CNNIC提供的相關數據,因此很具現實性,如表1所示)。
他們建立的數學模型,最后獲得的冪次數大約為2.124。依此模型推算,當99.5%以上的網站連接數均低于100次時,卻有萬分之四的網站大于1000次,十萬分之三的網站超出10萬次。因此,只要整合2至3千個網站作為主流資源,就可以在很大的程度上滿足老百姓的日常需求。
按冪次規(guī)律整合主流資源的同時,也應關注連接數較少的網站。這些網站是大量存在的,數量比主流網站多幾百倍、幾千倍。為什么它們的連接數較少,有三種可能: 1.有些網站因為內容質量較差,屬于競爭中的失利者; 2.有些網站品味很高,專業(yè)性太強,很少人看得懂; 3.還有一些網站屬于“真理掌握在少數人手里”,只是暫時未被大多數人接受而已,雖然沒有列入被整合的“主流”名單,但絕不等于應該列入取締對象,它們將繼續(xù)“散居”于互聯網之中,靜候網民的按需訪問。
互聯網應增添次級結構
兩種資源并存的現實給我們帶來了新的思考: 互聯網是否應該增添一種專門用于傳播主流資源的次級結構?讓主流資源通過衛(wèi)星廣播直達全國城鄉(xiāng),克服數字鴻溝?在主流信息大量分流后,主結構也將變得“輕松”。
圖3 雙結構互聯網的示意圖
如圖3所示,我國大約有一億網民,有67萬個Web站點,這是兩個直徑很大的圓。根據無尺度(scale-free)規(guī)律,其中屬于主流資源的不會超過幾千個站點,這是一個很小的圓。小圓是Web服務的“芯”(core),也是主結構的“芯”,如果我們把“芯”鏡像出去,在廣播中心營造幾何上的第二中心,通過廣播的機制,直接覆蓋全國鄉(xiāng)村與城鎮(zhèn),就形成互聯網的次結構。
雙結構中的主結構(primary)可依靠現有互聯網技術,而次結構(secondary)則可依靠播存網技術,兩者之間的區(qū)別比較如表2所示。
播存結構的終端有兩類: 一類是個體用戶,一類是采用透明計算模式的團體用戶。透明計算的服務器,從右邊收存大量來自播存結構的低成本信息資源,左邊通過現有的電信網與主結構雙向互聯,形成整合主次結構的“跨網”機制。
清華大學首創(chuàng)的透明計算還實現了操作系統(tǒng)的共享,使得團體用戶中的每一用戶的軟、硬成本和系統(tǒng)維護成本可降至最低,到我國城鄉(xiāng)大多數居民所能承受的范圍之內。通過透明計算和正在迅速發(fā)展的下一代電信技術(尤其是無線接入),主次結構互補整合,使窄帶的互聯也能獲得接近于寬帶互聯的效果。在這種情況下,主結構本身將得到進一步擴大(籃圈所示),保持向全人口持續(xù)增長的態(tài)勢。由此,下一代互聯網NGI,下一代廣播網NGB和下一代電信網NGN將循環(huán)相助、和諧相處。
2 共享信息的網格
最“正統(tǒng)”的網格研究來源于十幾年前美國政府資助的高性能計算項目,這類研究使用的名詞就是“網格(Grid)”或“計算網格”。
計算機專家試圖把整個Internet整合成一臺巨大的超級計算機,實現計算資源、存儲資源、數據資源、信息資源、知識資源、專家資源的全面共享。
在計算網格中,資源可分為“不可再生”和“可再生”兩大類,它們的共享難度,有很大的不同。計算資源和存儲資源屬于不可再生資源,服從總量守恒定律。所謂共享,只能是一種“分配”或“分享”。計算網格側重于整合不可再生的計算資源,希望通過計算資源的整合,達到提高與普及的雙重目標: 提高就是用若干臺高性能計算機得到一臺更高性能的計算機,普及是讓普通性能的計算機,通過聯網也能獲得高性能的計算能力。
數據資源、信息資源、知識資源則是另一類資源,它可以不限量再生,理論上用戶的規(guī)??梢浴安幌蘖俊痹鲩L。所謂信息網格,共享的資源是信息,可以不考慮非再生資源的共享,更容易實現更廣泛地共享。進入新世紀以來,有部份計算機專家轉向研究信息網格,并把網格的研究重點轉向普及化,讓網格的理念同如何擴大網絡規(guī)模,最終實現“無處不在”的“普適計算(pervasive computing)”聯系起來。
如何整合信息資源?美國國防部的“全球信息網格”(GIG)提供一個重要的思路。2000年美國國防部在向國會提供的報告中說,如果向戰(zhàn)士提供過多的信息,無異于把他們淹沒于信息海洋之中,容易失去做出正確判斷的時機。GIG并不要求把所有的信息資源送給所有的用戶,只要求“在適當的時機以適當的方式把適當的信息送給適當的人們”(getting the right information to the right people at the right time in the right format)。
重新審視互聯網與廣播網
網格在英語中稱為grid,幾何上指橫縱兩組平行線正交形成的柵格圖形。
從圖4的柵格圖形,可以看出信息網格的供需關系。一根橫線代表一個信息資源,一根縱線代表一個用戶,而圖中不同形狀代表著不同的信息資源,M根代表信息資源的橫線與N根代表用戶的縱線橫縱交叉,形成方形柵格。兩線交叉處的“交點”代表按需連接,它的物理意義是指它所關聯的第n個用戶按需共享第m種資源。一般而言,M的數量表示資源品種的豐富程度,N的數量表示資源共享的廣泛程度。理想的共享希望做到: 任一資源都有機會為N個用戶提供服務,任一用戶也都有機會得到M個資源的并行服務。也就是說,我們應該找到一種系統(tǒng),它的M值和N值都不設上限,這樣,信息共享將進入“各獻所知,各取所需”的理想境界。
圖4 研究網格的柵格模型
用這個標準來審視互聯網與廣播網,它們都存在一定的差距。
互聯網的優(yōu)勢在于M,信息資源的個數不設上限; 短處在于N,即用戶數目受到帶寬及服務質量的嚴格限制。廣播網正相反,優(yōu)勢在N,短處在M,只要信號強度足夠,它支持用戶數目的自由增長,支持共享服務普及邊遠山村,但廣播不支持信息資源品種的自由增長。
我們可從比較兩網的長處與短處入手,引出建立兩網互助互補的建議。
大約五年前,大家都以為只要投資擴大帶寬,“帶寬障礙”將迎刃而解。實踐征明,帶寬的增長很難全面解決用戶增長引發(fā)的一系列問題?!白畛跻还铩焙汀白詈笠还铩钡膶拵Щ?,只提供緩解矛盾的必要條件,不是充分條件。要求所有用戶對所有資源的連接都無障礙,等于要求全國互聯網中許許多多串接的路由器、網關和纜線任何時候都不發(fā)生帶寬障礙,這是一個“無底洞”式的難題。
傳統(tǒng)的廣播網,更非理想的信息共享手段。從用戶角度(縱線)看上去,電臺的內容是時間上串行播出的,信息資源在時間上時而出現,時而消失。什么時候廣播什么內容完全由電臺決定,個人缺乏通過雙向互動自由選擇的機會。
要讓廣播對理想的共享結構做出貢獻,必須在接收端引入存儲技術。存儲器是一種時間積分裝置,積累不同時刻播出的內容。用存儲器代替人,發(fā)送端可以同時播出幾十種乃至幾千種資源,不必顧慮用戶是否有空閑接應。在接收端,把臨時性串行出現的信息資源變成永久性并行存在的信息資源。人們很容易對近處存儲器實現雙向互動,自由選擇享用時間的問題也就迎刃而解了。應該說,“播存結構”的資源品種比傳統(tǒng)廣播網有質的飛躍。
“播存結構”保留傳統(tǒng)廣播網普適性(pervaive)的潛在優(yōu)勢。廣播衛(wèi)星就像信息陽光,普照960萬平方公里的中國大地,柵格圖形上的每條橫線都能承受得起無限數目的連接,用戶再多也不會給廣播帶來麻煩。用戶數目很容易從1億人上升到幾億人,直至全國13億人。最近幾年在中國興起的“廣播電視村村通”,只要把廣播電視節(jié)目換成萬維網的網頁,就很容易實現Web資源低成本的廣泛共享。
對比兩網的優(yōu)點缺點,我們萌生了一種變革信息服務的新思維: 先將廣播網改造成播存網,再用能夠包容海量資源的播存結構去幫助互聯結構克服帶寬障礙,爭取同時獲得M和N兩個數量的雙雙突破。
跨越“信息公路”概念
在互聯網中引入播存方式的次級結構,也許在短時間內很難取得網絡專家的認同,原因是 “信息高速公路”概念已根深蒂固?!靶畔⒐贰崩砟钜呀浱岢鍪畮啄炅?,這個比喻是戈爾(他的父親老戈爾是提出美國高速公路倡議的參議員)擔任副總統(tǒng)時期提出的,己經深入人心,多年來都沒有其他概念對其形成挑戰(zhàn),兩年前才由Barabasi等人在《科學美國人》上首次提出質疑,但迄今為止,仍然有不少專家不知道Barabasi所提出的思路。
圖5 美國高速公里網 (隨機網絡、符合正態(tài)分布)
Barabasi在 “無尺度網絡”一文中,指出只有隨機分布的網絡才能用美國高速公路系統(tǒng)的性能來描繪?;ヂ摼W巳從隨機網絡演化為無尺度分布的網絡,節(jié)點之間的連接服從冪次定律,多數節(jié)點只擁有少數連接,只有少數節(jié)點才擁有極大的連接。這種系統(tǒng)的性能應該用星爆形連接的美國航空網的性能來比喻(如圖5和圖6所示)。
圖6 美國航空網 (無尺度網絡,符合冪次公布)
不幸的是,人們依然習慣于用物質共享的方法去解決信息共享的問題,習慣于用物流的“公路”理念來解釋信息共享,誤以為“車多路堵”和“人多網堵”同樣無法抗拒,而弱勢地區(qū)、弱勢人群難以平等共享信息的現象,也是天經地義。人們在“數字鴻溝”面前束手無策,看不見“信息共享本應無沖突、享用的人數本可無上限”的光明前景。
互聯網從誕生的一刻起,就遵循“端對端“的原則,它的網絡層只提供“盡力而為之”的服務,可靠性與安全性要端系統(tǒng)自巳來保證。盡管“端對端”原則極大簡化了系統(tǒng)的復雜程度,但隨著網民、網頁規(guī)模的急劇擴張,單純“端對端”結構的負面效應逐步顯現: 除了網民規(guī)模難以擺脫帶寬限制、服務區(qū)域很難深入農村地區(qū)之外,規(guī)模(scale)越大,可靠性與安全性越沒有保證。
當然,是否可以依靠播存技術構成次級結構,也取決于廣播與存儲技術本身是否成熟。直到今天,廣播技術與存儲技術才發(fā)展到一個臨界點,達到足以直接平移大量萬維網網站內容的能力。
2004年6月,清華大學力合公司接受我們的建議,通過衛(wèi)星進行差分并播定比實驗,判斷這種可能性。實驗只利用DMB-S數十Mbps轉發(fā)能力中的0.5Mbps,故稱為定比下推(scaling down)實驗。把0.5Mbps再劃分為16個子信道,每個子信道32Kbps。每一個子信道分工傳輸一種文化傳媒(一種報紙,一個網站或一門課件),看每24小時能把多少字節(jié)的文化內容無差錯地送到全國各地。實驗和計算結果令人鼓舞: 一個凈數據率大于32Mbps的衛(wèi)星轉發(fā)頻道,每24小時有能力把超過345GB的網頁直接地送達全國城市的每一棟大樓和農村的每一個自然村。
2005年中國互聯網信息中心的研究人員統(tǒng)計,盡管中國互聯網網民巳超過1億人,國內67萬個網站,每天新投入網頁的字節(jié)量總加起來,估計為40GB/天左右,這一狀況將維持幾年不變。
340GB/天遠大于40GB/天,也就是說,中國人巳掌握這樣的衛(wèi)星廣播技術,有能力把所有網站一體化地轉到城鄉(xiāng)分布存儲。
播存結構的具體案例
同其他信息系統(tǒng)一樣,設想中的文化網格由信源、信道與信宿三大部份組成,它們分別稱為“整合一體的資源平臺”、“覆蓋全國的廣播信道”和“透明計算的網格終端”。
如圖7所示,為了說明文化網格的具體工作原理,我們討論用衛(wèi)星廣播整體平移3330種網站的案例。
圖7 基于播存結構的文化網絡
一、整合一體的資源平臺
用單一的載波整合數千網站。用戶只需通過單一的數據接口,便可以得到數千網站的主動服務。
我們把提供信息內容的報紙、期刊、課程內容的單位(ICP)統(tǒng)稱為網站,它們都以Web頁面的形式提供服務。
3330個網站分散于全國各地,剛剛編輯出稿的新鮮網頁,通過互聯網FTP或電信網專線瞬間送到廣播中心,在廣播中心形成一個容納所有網站鏡象數據庫。廣播中心的碼分并播軟件(以后詳細介紹),從數據庫中有序地取出數據,通過單一載波,以適當的速率和適當次數的重播,保征網頁在全國可靠落地。
廣播中心對幾千種網站平等相待。每一個網站都獨自掌握一定數量的子帶寬,有權在第一時間里向全國發(fā)布最新鮮、最重要的網頁,而不受其他網站工作狀態(tài)的影響。
衛(wèi)星數字廣播的總速率為32Mbps,每天都具備向全國同時推送超過340GB文件的能力。各個網站可根據編輯出稿能力(每天大約可以向網格提供多少字節(jié)的非重覆內容),向廣播中心申請獨立享用子帶寬。全網32Mbps的數據速率,合理分配,可供30個巨型網站(內容提供少于3GB/天,申請320Kbps的子帶寬)和300個普通網站(內容提供少于300MB/天,申請32Kbps)MB以及3000個小型網站(內容提供少于30MB/天,申請3.2Kbps)共同享用。根據初步調查,我國尚未出現日產超過1GB(不含視頻)內容的網站,因此,以上估計是留有一定冗余的。
二、覆蓋全國的廣播信道
廣播中心通過同步衛(wèi)星轉發(fā),將網頁直接落地于全國城鄉(xiāng)。中途沒有路由轉接,沒有信道擁堵; 不分先后順序,立即到達、全部到達。地面的任務,只是根據統(tǒng)一內容定位代碼,從中挑選出用戶有興趣的網頁下載存儲。
為什么信道可以如此簡單,原因在于接收端擁有海量存儲能力。信道在存儲之前,而不是在后。
Web存儲是按“一次寫入、多次讀出”原理工作的,播存結構在“存內容于網站”的基礎上,實現“存網站于本地”的變革,把存儲挪到通信的后邊。昨天、前天的網頁寫入終端存儲器,不再需要通過信道傳輸了,信道只需傳輸新鮮內容或差分內容。這種“差分信道”,與讀出無關,不介入讀者與網頁的雙向互動,“一次廣播,一勞永逸”,比互聯網要簡單多了。
三、透明計算的網格終端
播存網格中的終端,負責有選擇地下載、存儲廣播信道中的信息內容,并向用戶提供實時的內容服務。通過網格終端,用戶無需感知信息資源的具體所在,便可以得到多種信息資源的按需服務,如同只要插上電源,就可以得到電力網(Power Grid)的服務一樣,這本身就是一種“透明”的概念。
網格的終端,可以直接設在家中,利用PC機的硬盤作為終端存儲。但此時PC機必需24小時連續(xù)工作,否則會漏掉關機時間播出的網頁。為了實現低成本,比較現實合理的辦法是,存儲器設在離用戶不遠的服務器中,幾家人或者幾十家人可以共用一個服務器,家庭中的客戶機可以非常簡單。連續(xù)工作的存儲成本可以由大家來分擔,而且客戶機本質上只是一種NC(網絡計算機),任何顯示設備(包括家用電視機)只要添加一個小盒子就可以成為客戶機。
清華信息科學與技術國家實驗室的相關研究小組研究和開發(fā)的透明計算環(huán)境,服務器不僅可以存儲信息資源,還存儲操作系統(tǒng),實現操作系統(tǒng)的共享。而幾個或幾十個最終用戶,共享同一個服務器里存儲的多種資源,也使得用戶成本進一步下降。
透明計算的網格終端服務器中存儲的信息資源有三類: 操作系統(tǒng)、應用軟件和已下載的信息內容,這些信息內容可以來自播存網格中的廣播信道,也可來自其他網絡,包括互聯網、電信網等,因此,透明計算的網格終端本身也可以成為多種網絡整合的場所,實現信息資源的按需整合。
3 數字廣播面臨重大變革
廣播數字化遇到困難
傳統(tǒng)的廣播電視,盡管仍然是吸引“人時總數”最多的最大媒體,但從用戶的角度觀察,其資源在時間上是陣發(fā)性出現的,大部份時間內用戶得不到這些內容,只有電臺正在廣播的時間里,才有可能得到它的服務。廣播資源時間上的間歇性存在,造成傳統(tǒng)廣播若干固有的結構性缺陷。
首先,它難以實現按需服務,內容與時間由電臺決定,用戶對信息資源不能雙向互動,缺乏自主權。其次,提供的資源品種不夠豐富,尤其是缺少靜態(tài)視覺的書刊、網頁,不能反映數字文化的博大精深。最后,缺乏形成產業(yè)的經濟杠桿,傳統(tǒng)廣播很難形成產業(yè),廣告收入之外,難以找到市場的經濟支持,優(yōu)秀節(jié)目得不到正比于貢獻的回報。
廣播數字化的困難,從最近幾年數字電視進展遲緩的過程中充分表現出來。原先預想: 我國2003年底使數字電視用戶達到3000萬戶,而實際只有十幾萬戶,2004底也只有百萬戶左右,因此2005年只能把指標再次調低。進度遲緩的情況在國外同樣存在,美國原定2006年切斷模擬電視,看來目標也相差甚遠,時間表只能后延,據說歐洲到2010年數字化率也只能達到五成左右。
當廣播數字化遇到某種困難的關鍵時刻,不少專家獻計獻策,建議數字化不應該停留在改善圖像質量和增加電臺數量之上,應該將終端引入雙向互動的“客戶機/服務器(C/S)”結構,完成廣播業(yè)服務方式變革。
在廣播終端引入海量存儲,可以積累不同時刻播出的內容,把瞬態(tài)存在的廣播數據流,變成為時間上長期存在的服務器數據庫,向最終用戶提供雙向式按需服務。這就是所謂“播存結構”。播存結構不僅可以實現電視節(jié)目的按需服務,還將承擔普及幾千種報刊網站和幾千門大中小學課程的任務,為科教興國營造“存文化于民間”的環(huán)境。
基于播存結構的下一代廣播
一、對下一代廣播的設想
下一代廣播,是根據“整合資源,廣泛共享”的“網格”思想設計的。如圖8所示,其中包括三種網格,即電視網格(整合上百種電視節(jié)目)、文化網格(整合幾千種報刊、網站)和教育網格(整合數千種大中小學課程)。終端采用海量存儲,用戶不但對極其豐富資源具有自由選擇的權力,而且全國城市的每一棟大樓,農村的每一個自然村,都可以擁有這樣的資源。
下一代廣播,既是一個大的世界,也是一個小的世界,其分界在終端存儲器。
終端存儲之前,是由龐大的單向廣播系統(tǒng)所構成的大世界。數以千計的各種信息資源,經地面整合之后,形成DVB-S單一射頻載波,通過同步軌道衛(wèi)星轉發(fā),覆蓋中國國土,再通過地面有線(DVB-C)或地面無線(DMB-T)到達海量存儲的終端服務器。大世界采用大量成熟的硬件設備和少量創(chuàng)新的軟件(如差分并播程序、基于UCL的信息過濾代理等)技術。
終端存儲之后便是一個小范圍、短距離的“服務器/客戶機”雙向互動系統(tǒng)。這是一個小世界,它只為百米之內的百個以下的客戶機提供服務。正因為它的小和少,服務器與客戶機之間幾乎沒有帶寬瓶頸,而且成本極其低廉。小世界采用透明計算模式??蛻魴C盡可能簡單(瘦身),普通電視機或手機上的顯示設備,只要增添一個“機卡分離”的插卡便可以成為客戶機。
迄今為止,大多數人主張“遠互動”,雙向通信需要跨越比較長的距離。例如,IPTV就是把資源服務器設在電信局里,通過雙向工作的ADSL與客戶機實現互動。這類方案存在兩個問題: 一是下行帶寬不足,只能支持分辨率較低的視頻服務; 二是運作成本太高,以電信業(yè)按時間或按流量方式收費,即使資費水平再有大幅度降低,普通居民也難以承受。
二、選擇終端存儲的理由
業(yè)界比較關注的是,運算速度和通信帶寬進步很快,但很少人注意到存儲成本下降更快。三十年來,每百萬字節(jié)數字存儲的價格下降已超過一千萬倍。如圖9所示,1973年百萬字節(jié)的存儲器售價幾十萬美元,相當于一座小洋房,以后陸續(xù)下降,相當于一輛汽車、一輛自行車……
2005年,中關村市場80GB硬售價已低于800元人民幣,百萬字節(jié)存儲成本已降到不到人民幣一分錢。更令人鼓舞的是,存儲器的成本還將持續(xù)下降。科學家已經指出成本繼續(xù)下降的空間,只待工程師把它變成現實。
三、雙向互動
不同時間、不同電臺播出的內容進入存儲器之后,串聯播出和瞬間存在的信息資源,變成永久存在和隨意調用的并列資源。人們再也不受“廣播節(jié)目時間表”束縛,隨時隨意點取自已有興趣的內容。
廣播的按需服務從誕生一刻起就將是滿足“質量保證(QoS)”需求的,萬維網的按需服務通過“存內容于遠處”實現,從網站與用戶之間要途經多個節(jié)點,任何一個環(huán)節(jié)的帶寬瓶頸都可能造成時間滯后,最終用戶所獲得的QoS難以保證,而播存結構“存內容于近處”,沒有帶寬瓶頸,沒有滯后環(huán)節(jié),隨點隨得。
四、豐富內容
海量存儲器除了收集電視節(jié)目和音頻節(jié)目之外,還可以增添直播衛(wèi)星轉播的、從萬維網精選出來的報刊、網站與課程,包括了數字文化全部常用內容??梢哉f,每一終端存儲器,就是一座數字圖書館,其內容的豐富程度,達到相當理想的程度,可以隨著存儲容量而線性增長。如果城市的每棟大樓和山區(qū)的每一個自然村,都擁有一個這樣的數字圖書館,中國將迎來第二次“存文化于民間”的高潮(第一次高潮發(fā)生在一千年前畢升發(fā)明印刷術之后)。
五、形成產業(yè)
終端服務器是廣播網格公用設施的最后一部份,為幾個家庭所公用。任何客戶機從存儲器中取走內容,服務器都將詳細記錄在案,準確扣除交費卡的金額。因此,可以把存儲器當成是信息產業(yè)的零售商,看成是家門口自動經營的文化超市,由內容提供者標明價格(包括標明免費),并直接得到用戶回報,網格公司只是從回報中提取固定比例作為服務費。用這個辦法,兼容網格的公益性與產業(yè)性,并使廣播成為服務業(yè)的新內容之一。
差分并播技術
傳統(tǒng)廣播采用時間上串列出現的“串播”。播存結構取消“節(jié)目時間表”,實施各種內容并列出現的“并播”。本質上看,并播是一種時間復用,每一個網站占用一個子信道。各子信道按時分復用原理工作,速率有1倍速、10倍速和0.1倍速三種。以總速率為32Mbps,1倍速為32Kbps為例,一個廣播頻道共可容納3330個網站,其中有30個網站分享320Kbps、300個網站分享32Kbps、3000個網站分享3.2Kbps的子速率,所有的子信道并行工作,就像大規(guī)模并行計算中CPU并行工作那樣。
差分并播是并播的一種改進??紤]到網站編輯出稿新鮮網頁是陣發(fā)性的,時間上非均勻的。當它出稿的網頁已被播出幾遍之后,地面各接收站都已正確收存,再重復廣播已經沒有意義。于是,制定一種優(yōu)待新鮮(差分)內容的“禮讓準則”。例如,規(guī)定某網站文本數據重播超過五遍,語音超過二遍,視頻超過一遍之后,主動退出對子信道的占用。因此,發(fā)送端不同時刻正在播出的網站數目是變動的,每一個網站的下載速率也是變化的。只當3330個網都有新鮮網頁需要播出的特殊情況下,各網站的速率才回落到最低值,即按預先約定的速率播出,大部份時刻,實際速率將大于預約值,甚至大大地大于預約值。
在播存結構的接收端,用數據包包頭的UCL代碼確定是否下載,它本質上是一種“碼分”接收,無論子速率多少,也不管有多少網站需要下載,數據包都不會丟失,這種方法又稱為“碼分并存”。
差分并播和碼分并存軟件是下一代廣播的關鍵技術。國家可以用兒十兆的帶寬整合全國數以千計的信息資源,地方城市用較小的帶寬整合數目較少資源。例如,用15Mbps的DMB-T無線廣播,除并列組織十幾種電視節(jié)目之外,再并列組織上百種滿足當地老百姓日常需求的報刊網站,覆蓋一個大城市,用很少的投資就可把數字文化送到家家戶戶。
李幼平
中國工程院信息與電子工程學部院士,電子工程學家,也是我國核武器電子學領域的主要學科帶頭人之一,在無線電遙測、遙控和引爆控制系統(tǒng)的研究領域作出重要貢獻。
4 透明計算的網格終端
為什么引入透明計算
透明計算是一種計算模式,用戶在使用計算機系統(tǒng)時,無需感知操作系統(tǒng)、中間件、應用程序和信息資源的具體所在,只憑用戶需求,通過網絡便可得到相應的計算服務。
我們希望未來的信息網格能做到:只要用戶提出對信息內容的要求,就可以得到相應的網頁,無需感知網頁來自何種網絡。
引入透明計算的第二個原因,是我們希望能找到一種“最低成本”的終端方案。原則上說,在播存結構中的單向廣播可以一直延伸到家庭,利用家庭PC機中的硬盤作為終端存儲,此時要求PC機需要“永不關機”,運行成本較高。用“客戶機/服務器(Client/ Server)”方式,由幾家人來分擔服務器、操作系統(tǒng)、中間件等軟硬件的固定成本和運行成本,有利于降低用戶承擔的費用。用戶費用低,才能普及化,最終實現普適計算的目標。
透明計算的核心思路
在計算機技術的發(fā)展過程中,CPU、內存、外存儲器、輸入輸出設備一直是計算機硬件的幾大主要部分,而操作系統(tǒng)(OS)和支持工具(中間件)以及相關應用軟件則構成了計算機軟件系統(tǒng)。迄今為止,盡管Web服務技術和網絡存儲技術等為用戶提供了網上高層(應用層)信息資源共享和應用軟件的復用,但是計算機的硬件和OS一起才能構成一臺可使用和操作的系統(tǒng),這種方式造成了當前計算機發(fā)展中存在的幾個主要問題:即不斷升級問題、兼容性問題,和病毒及盜版問題。
如何解決上述問題?特別是在普適計算時代,針對那些內存、外設都較小的各種各樣的計算設備,如何減少它們的升級換代,如何使它們能夠運行不同的OS環(huán)境,為用戶提供不同的服務,如何進一步減少病毒?使計算機變得更便宜一點,更安全一點,資源共享更容易一點,就是透明計算試圖解決的問題。
圖10是在一個基于透明計算模式的系統(tǒng)中,用戶可選擇Windows 2000、Linux及Windows 98的初始圖,在圖10中,用戶可任意選擇3個OS中的任一系統(tǒng)運行。
從計算機系統(tǒng)開放性的角度來看透明計算,它其實也是計算機系統(tǒng)進一步開放的必然結果。
傳統(tǒng)計算機的軟硬件的層次關系如圖11所示。應用軟件依賴于下層的中間件工具和編程環(huán)境,中間件和編程環(huán)境依賴于下層的操作系統(tǒng),操作系統(tǒng)依賴于硬件。在這樣的體系結構下,計算技術的發(fā)展也是體系結構不斷開放的過程。每一個更加底層的接口被開放,就意味著上層軟件可以自由開發(fā)和選擇,將極大地推動計算機技術的發(fā)展。
透明計算實際上是遵循開放的理念,將操作系統(tǒng)和硬件之間的接口開放,只要計算機CPU支持相關操作系統(tǒng)和硬件接口,該硬件系統(tǒng)就可以在開機運行之前不裝操作系統(tǒng),而是等待加電后透過網絡從服務器上下載該系統(tǒng)并隨后運行,正是由于開放了這個底層的接口,才導致透明計算模式的實現。透明計算由客戶機/服務器模式組成,其拓撲連接示意圖如圖12所示。
圖12中的服務器既可以是單臺,也可以是多臺;其網絡既可以是有線網,也可以是無線網;既可以是局域網,也可以是廣域網。只是,其網絡的傳輸速度必須滿足服務器與客戶機之間程序和數據傳輸的需要。透明計算中的客戶機負責完成客戶端應用程序的計算工作,服務器端只負責進行資源存儲和管理,客戶機所需要的任何應用程序、中間件及OS都通過動態(tài)的請求調頁方式從服務器中獲得,服務器和客戶機的體系結構如圖13所示。
綜上所述,我們可以總結出透明計算模式的幾個主要技術特點如下:
1.客戶機上不預置任何OS,但用戶可在執(zhí)行時通過網絡選擇所需要的、并與客戶機兼容的任何操作系統(tǒng)。
2.所選OS和應用并不是一次全部下載到客戶機上,通過動態(tài)調度,根據客戶機內存大小,采用分頁調度方式,按計算需要分頁下載,從而減少了客戶機內存和CPU需求。
3.所有的客戶機應用計算都在客戶機上完成,資源和數據的存儲在服務器上,這使得資源共享更加容易。
4.使用和維護分離: 由于所有的資源都放在服務器上,因此,維護管理人員只需維護管理服務器則可; 客戶機主要提供給用戶使用,使用戶擺脫繁瑣的OS安裝、數據維護等工作。
透明計算作為網格終端
透明計算環(huán)境因其低成本、易管理、易操作、高安全性和高可靠性等特點,非常適合用于搭建播存網格的終端環(huán)境,為播存網格的終端用戶提供低成本的用戶環(huán)境和實時的內容服務,如圖14所示。此時,透明計算服務器負責各種網絡的接入和整合,將來自不同網絡的信息資源統(tǒng)一存儲并管理起來。同時,透明計算服務器通過OS遠程啟動和管理模塊支持多種操作系統(tǒng)的遠程系統(tǒng)。對于用戶來說,他首先在透明計算客戶機上自主選擇所需要的操作系統(tǒng)并啟動,然后調用相應的應用軟件訪問已經存儲在“近處”的信息資源,而不需關心操作系統(tǒng)本身、應用軟件和信息資源的具體所在,這是一種“透明”的概念。
同時,透明計算在播存網格中的應用也可以用柵格模型來描述(這方面內容可參見前文《共享信息的網格》),如圖15所示。因此,透明計算本身也是一種“微網格”。由此,透明計算環(huán)境可以為播存網格提供多方面的條件和服務,主要包括:全天候的存儲終端、多種網絡的整合場所、低成本的服務環(huán)境,以及減免病毒垃圾的潔凈內容。
總論
推進三網和諧整合
中國互聯網已經擁有超過一億的網民,僅次于美國成為全球第二互聯網大國。但是,網民數仍然只占全人口的不足8%,普及化水平只相當全球平均水平的一半左右,相對而言,在固話、移動通信和電視領域,我國的普及率都已超過全球平均水平,互聯網則因此更顯落后。
本期這一組文章的目的,正是在于說明一種“普及互聯網”的思路。
首先,運用冪次定律,從幾十萬個網站中精選出數千種“主流信息資源”;其次,運用衛(wèi)星數字廣播,一體化地把主流資源分布存儲于城市的大樓和每一個自然村,造成跨越數字鴻溝和“存文化于民間”的全國性態(tài)勢;最后,運用透明計算模式,把服務器與客戶機都不發(fā)達可能做到低成本,向全體人民(包括不發(fā)達地區(qū)和弱勢人群)提供雙向按需服務。
播存結構將帶來下列好處:
● 支持寬帶用戶持續(xù)增長;
● 數字文化上山下鄉(xiāng);
● 緩解現有網絡的帶寬壓力;
● 窄帶電信接入重現生命力;
● 手機、電視機用戶變成互聯網用戶;
● 播存網格本身是一種“下一代廣播網”。
古人云:“君子和而不同,小人同而不和”,我們應該借助古人和諧處世的思想,借助播存結構作為手段,實現互聯網、廣播網和電信網的相互幫助與和諧整合,如圖16所示。
- 1如何避免軟件開發(fā)中不兼容的設計方法
- 2泛普軟件:五步驟,讓OA軟件更加安全
- 3解析三大容災技術
- 4數據大清理
- 5大型企業(yè)如何選用OA辦公系統(tǒng)
- 6企業(yè)管理離不開OA協(xié)同這個潤滑劑
- 7中小企業(yè)機房綜合管理設備評析
- 8OA軟件為單位實現強而有力的企業(yè)管控
- 9OA從業(yè)價值觀:百年老店還是畫地為牢
- 10布線的質量保證
- 11移動OA助企業(yè)管理水平創(chuàng)新高
- 12泛普軟件:OA系統(tǒng)實施省錢攻略
- 13電子商務、企業(yè)社交是大型企業(yè)信息化重點
- 14應用軟件成為黑客“潛在武器”
- 15企業(yè)輕松管理辦公 一切從OA開始
- 16布線在亂局與希望中成長
- 17OA系統(tǒng)常見問題不行別珍惜
- 18無線局域網站點測量
- 19移動OA 外出碎片時間也可創(chuàng)效益
- 20廣域網快速實現遠程的文件服務
- 21用好的OA軟件 節(jié)約企業(yè)資源
- 22下一代網絡長什么樣
- 23幾種流行的數據庫系統(tǒng)
- 24你在路上,辦公在手上
- 25EJB 3.0的三大類型
- 26談協(xié)同OA系統(tǒng)普及化的重大意義
- 27OA系統(tǒng)助咨詢業(yè)優(yōu)化流程管理
- 28不同的人對OA的認識是不同的
- 29PDRR網絡安全模型
- 30移動互聯時代讓OA系統(tǒng)行動起來
成都公司:成都市成華區(qū)建設南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓