監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

“大數(shù)據(jù)”化生活喜憂參半

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

牛津大學(xué)的維克托·邁克·舍恩伯格教授被譽(yù)為“大數(shù)據(jù)時(shí)代的預(yù)言家”,他將大數(shù)據(jù)對(duì)我們生活的影響稱為一場(chǎng)“變革”。

不少人都曾有過這種經(jīng)歷——剛打開微博,網(wǎng)頁就給你推薦了一些“你可能認(rèn)識(shí)的人”,而這些人里面,還真有不少你失去聯(lián)系多年的朋友、同學(xué);打開購物網(wǎng)站,在網(wǎng)頁上顯示的推薦購物清單里頭,你真的發(fā)現(xiàn)了一些自己正打算購買的物品;打開新聞網(wǎng)站,系統(tǒng)推薦的新聞?wù)心愕奈缚凇?/p>

其實(shí),這些都有賴于“大數(shù)據(jù)技術(shù)”,這些網(wǎng)站通過分析你的瀏覽搜索習(xí)慣等眾多數(shù)據(jù),分析出你的喜好、社交圈甚至是生活習(xí)慣……

從大數(shù)據(jù)中贏得決斷

成功預(yù)測(cè)總統(tǒng)大選結(jié)果

去年美國總統(tǒng)大選時(shí),數(shù)據(jù)專家納特·席爾瓦(Nate Silver)以大數(shù)據(jù)為基礎(chǔ),成功預(yù)測(cè)了幾乎每個(gè)州的大選選情和最后的勝出者。當(dāng)時(shí)奧巴馬和羅姆尼選情普遍認(rèn)為很接近,評(píng)論員們都無法預(yù)計(jì)哪方會(huì)獲勝,席爾瓦以主要民調(diào)機(jī)構(gòu)在各州不斷更新的訪查結(jié)果為基礎(chǔ),計(jì)算出“真實(shí)”情況,指出二者并非處于旗鼓相當(dāng)?shù)木置?。在投票?dāng)天他成功預(yù)測(cè)奧巴馬將有90.9%的機(jī)會(huì)獲得大多數(shù)選票,最后他對(duì)美國50個(gè)州投票結(jié)果的預(yù)測(cè)全對(duì)了。

事實(shí)上,2008年美國總統(tǒng)大選時(shí),席爾瓦也預(yù)測(cè)對(duì)了最終結(jié)果,美國50個(gè)州的投票結(jié)果他預(yù)測(cè)對(duì)了49個(gè)。

預(yù)測(cè)罪案發(fā)生的時(shí)間地點(diǎn)

許多公共服務(wù)部門,尤其是警察局和安保機(jī)構(gòu),也開始享用大數(shù)據(jù)帶來的好處。一些城市已經(jīng)運(yùn)用大數(shù)據(jù)推算出了某些街區(qū)發(fā)生罪案的幾率。美國加利福尼亞州圣克魯茲市就是其中之一。

大數(shù)據(jù)算法可以計(jì)算出某時(shí)某地罪案(入室行竊、搶劫、偷車,但不包括殺人案)發(fā)生的幾率,在過去兩年中,該市的大約100名巡警在巡邏時(shí)會(huì)有針對(duì)性地出巡,他們攜帶的電子卡上會(huì)顯示出附近最有可能發(fā)生罪案的15處地點(diǎn)。而在三分之二的情況下,大數(shù)據(jù)算法預(yù)測(cè)的罪案都確實(shí)發(fā)生了。根據(jù)該市警察局局長(zhǎng)克拉克的介紹,引入這個(gè)大數(shù)據(jù)算法后,該市的入室行竊案件減少了11%,偷車案減少了8%,相應(yīng)的,逮捕罪犯的成功率則提高了56%。

現(xiàn)在,美國已經(jīng)有超過10市的警察局引入了這個(gè)大數(shù)據(jù)算法,其中包括洛杉磯、波士頓和芝加哥。

相親、治病也靠它

除了為企業(yè)創(chuàng)造利潤,大數(shù)據(jù)還能為人類社會(huì)帶來別的好處。

對(duì)于許多人來說,他們生活中最私密的方面也已經(jīng)開始依賴于這種機(jī)械算法的預(yù)測(cè)能力了。例如,許多在線相親機(jī)構(gòu)都會(huì)要求你填寫一份非常詳細(xì)的問卷,然后根據(jù)大數(shù)據(jù)算法來提高你找到另一半的幾率。

本月初,英國首個(gè)綜合運(yùn)用大數(shù)據(jù)技術(shù)的醫(yī)藥衛(wèi)生科研中心在牛津大學(xué)成立。據(jù)介紹,這個(gè)研究中心通過搜集、存儲(chǔ)和分析大量醫(yī)療信息,確定新藥物的研發(fā)方向,從而減少藥物開發(fā)成本,同時(shí)為發(fā)現(xiàn)新的治療手段提供線索。

英國曼徹斯特大學(xué)的研究者們正在進(jìn)行針對(duì)獨(dú)居老人的“魔毯”計(jì)劃。“魔毯”看起來就像一張普通的地毯,但是裝滿了用來記錄老人腳步的傳感器,這些數(shù)據(jù)會(huì)被上傳,計(jì)算機(jī)可以將之與老人健康時(shí)的腳步相比較,然后分辨出老人是否出現(xiàn)需要就醫(yī)的緊急情況,若是,則會(huì)自動(dòng)觸發(fā)警報(bào)。

“大數(shù)據(jù)”無處不在

谷歌公司在2009年比美國國家疾控中心更早知道甲型H1N1流感的暴發(fā)時(shí)間、地域;蘋果之父喬布斯是全球第一個(gè)擁有自身整個(gè)基因密碼的人;美國Target百貨公司在完全不和顧客溝通的情況下比少女的父親更早知道女兒懷孕的信息。

這些也僅僅是大數(shù)據(jù)時(shí)代的冰山一角,大數(shù)據(jù)的作用不僅限于此。無論企業(yè)還是政府,都已經(jīng)意識(shí)到將巨量的數(shù)據(jù)進(jìn)行計(jì)算分析并進(jìn)行下一步的推測(cè)非常有用。

但是,大數(shù)據(jù)帶來的不僅是各種便利及機(jī)會(huì),同樣也會(huì)讓我們時(shí)刻都暴露在“第三只眼”之下,個(gè)人隱私受到了前所未有的威脅。

說到大數(shù)據(jù),必須先了解之前的“小數(shù)據(jù)”時(shí)代。鑒于工具及方法的局限,很難做到大規(guī)模的數(shù)據(jù)采集并進(jìn)行分析,而且成本頗高、時(shí)效性差。為解決問題,統(tǒng)計(jì)學(xué)家們發(fā)揮出作用,提出以隨機(jī)采樣的方式來替代全數(shù)據(jù)采集,不過其成功取決于樣本選擇的隨機(jī)性,但實(shí)際上非常難以實(shí)現(xiàn),一旦采樣過程存在任何偏見,分析結(jié)果就會(huì)相去甚遠(yuǎn)。來到大數(shù)據(jù)時(shí)代,由于有了足夠的數(shù)據(jù)處理和存儲(chǔ)能力,加上最先進(jìn)的分析技術(shù),就能做到放棄樣本分析這條捷徑,選擇收集全面而完整的數(shù)據(jù),即采取全數(shù)據(jù)模式“樣本=總體”。

大數(shù)據(jù)的特點(diǎn)就是“大”,而且隨著時(shí)間的推移,數(shù)據(jù)的容量將會(huì)越來越大。2012年一年,我們創(chuàng)造了2.8澤字節(jié)(澤)的數(shù)據(jù)。1個(gè)澤字節(jié)為1,000,000,000,000,000,000千字節(jié)。專家預(yù)測(cè)說,到2020年,每年新創(chuàng)的數(shù)據(jù)容量將會(huì)達(dá)到40澤字節(jié)。如果要用DVD光盤儲(chǔ)存一天在互聯(lián)網(wǎng)里傳送的數(shù)據(jù)的話,大約需要2.5億張光盤——這個(gè)數(shù)量每?jī)赡昃蜁?huì)翻番。

大數(shù)據(jù)創(chuàng)造大價(jià)值

現(xiàn)在,企業(yè)、政府機(jī)構(gòu)和科學(xué)家們都開始分析手頭的數(shù)據(jù)資源。儲(chǔ)存空間對(duì)于現(xiàn)代人來說不是問題,電腦也越來越先進(jìn),可以在短時(shí)間內(nèi)分析出一大堆不同數(shù)據(jù)的內(nèi)在聯(lián)系。

大數(shù)據(jù)本身對(duì)普通人的作用其實(shí)不大,但大數(shù)據(jù)算法和應(yīng)用程序現(xiàn)在卻幾乎無處不在。例如,通過算法對(duì)大數(shù)據(jù)進(jìn)行分析,信用卡公司能夠很快地發(fā)現(xiàn)用卡異常情況,當(dāng)信用卡在持卡人從未出現(xiàn)過的地方被刷時(shí),系統(tǒng)會(huì)自動(dòng)向持卡人發(fā)出警報(bào);能源公司可以通過天氣數(shù)據(jù)分析,精確地查找到使用風(fēng)力渦輪發(fā)電機(jī)的理想地點(diǎn);電商也開始通過數(shù)據(jù)分析優(yōu)化營銷策略,最常見的就是網(wǎng)頁上的“購買了這件商品的顧客還買了……”

大數(shù)據(jù)創(chuàng)造價(jià)值是基于這樣一個(gè)核心邏輯,即當(dāng)今社會(huì)在商業(yè)、經(jīng)濟(jì)、政府及相關(guān)領(lǐng)域中,決策行為越來越取決于數(shù)據(jù)和分析,而不再是經(jīng)驗(yàn)和直覺。大數(shù)據(jù)技術(shù)可以為決策提供一定的“預(yù)見參考”,而成功的分析和預(yù)見往往能帶來商業(yè)和經(jīng)濟(jì)價(jià)值。

谷歌和臉譜網(wǎng)站目前的商業(yè)模式就是建立在搜集、分析和營銷其客戶制造出來的各類數(shù)據(jù)之上的,通過向用戶推送為其量身定做的廣告來實(shí)現(xiàn)。對(duì)于臉譜公司的投資者來說,“臉譜”掌握著超過10億個(gè)人的資料數(shù)據(jù),其商業(yè)價(jià)值至少達(dá)到1000萬美元。從超市到汽車公司,從航空公司到銀行和保險(xiǎn)公司,將手頭的巨量數(shù)據(jù)轉(zhuǎn)化成盈利的前景讓各行各業(yè)都開始心動(dòng)。德國最大的上網(wǎng)行為產(chǎn)業(yè)協(xié)會(huì)B上網(wǎng)行為KOM發(fā)表數(shù)據(jù)稱,2012年全球與大數(shù)據(jù)應(yīng)用相關(guān)的銷售額達(dá)到了46億歐元,到2016年這個(gè)數(shù)字會(huì)上升到160億歐元。

說到商業(yè)應(yīng)用,大數(shù)據(jù)技術(shù)創(chuàng)造價(jià)值的能力已經(jīng)在英國嶄露頭角。一份行業(yè)報(bào)告顯示,英國政府通過高效使用公共大數(shù)據(jù)技術(shù)每年可節(jié)省約330億英鎊,相當(dāng)于英國每人每年節(jié)省約500英鎊。

一些政府機(jī)構(gòu)也開始利用大數(shù)據(jù)來改進(jìn)工作。在瑞典首都斯德哥爾摩,有關(guān)部門使用數(shù)據(jù)算法管理交通后,駕車通過該市中心城區(qū)的時(shí)間縮短了一半,尾氣排放也下降了10%。

雖然經(jīng)濟(jì)不景氣,財(cái)政被迫收緊,但大數(shù)據(jù)依然是英國政府舍得為之一擲千金的“寵兒”。今年年初,英國商業(yè)、創(chuàng)新和技能部宣布,將注資6億英鎊(1英鎊約合1.52美元)發(fā)展8類高新技術(shù),大數(shù)據(jù)獨(dú)攬其中的1.89億英鎊。

在醫(yī)藥和科學(xué)界,與大數(shù)據(jù)有關(guān)的應(yīng)用也相繼試水。

生活在“第三只眼”下

大數(shù)據(jù)帶來的不僅是各種便利及機(jī)會(huì),同樣也會(huì)讓我們時(shí)刻都暴露在“第三只眼”之下。

生活處處被窺視

亞馬遜網(wǎng)站監(jiān)視我們的購物習(xí)慣,谷歌監(jiān)視著我們的網(wǎng)頁瀏覽習(xí)慣,而微博竊取著我們的社交關(guān)系網(wǎng)。在各種機(jī)構(gòu)搜集數(shù)據(jù)的同時(shí),普通人的各種私人信息也會(huì)成為被收集的數(shù)據(jù)。在哪里使用了購物卡、租用汽車等等,這些信息都會(huì)被收集起來。

這些私人信息被收集起來后會(huì)供給誰使用?會(huì)繼續(xù)保持匿名,還是在使用后被刪除?曾經(jīng)有公司宣布要通過“臉譜”、推特和其他社交網(wǎng)站收集的信息分析個(gè)人的貸款信譽(yù),結(jié)果引發(fā)了民眾的抗議,這個(gè)計(jì)劃最終被取消。

在荷蘭,許多使用“TomTom”牌導(dǎo)航儀的司機(jī)發(fā)現(xiàn),生產(chǎn)商將導(dǎo)航儀記錄下來的數(shù)據(jù)信息打包賣給了荷蘭政府,警察根據(jù)數(shù)據(jù)顯示的司機(jī)駕駛習(xí)慣,在那些最可能“創(chuàng)收”的地方設(shè)置了限速“陷阱”,不少司機(jī)都因此“中招”。此事被曝光后,TomTom公司的CEO公開道歉。

可能遭遇數(shù)據(jù)“轟炸”

當(dāng)大數(shù)據(jù)應(yīng)用軟件細(xì)化和明確到每個(gè)人的數(shù)據(jù)時(shí),企業(yè)就可以針對(duì)每個(gè)人的喜好來進(jìn)行非常具體的營銷。例如,如果某人在社交網(wǎng)站上表示自己喜歡某個(gè)品牌某個(gè)款式的牛仔褲,那么百貨商店就可以在此人下一次進(jìn)入該品牌專柜時(shí)向他的手機(jī)發(fā)送該款式的優(yōu)惠券。也許零售商和部分消費(fèi)者會(huì)喜歡這種促銷模式,但是其中涉及的隱私泄露也是非??膳碌?。

迄今為止,許多公司都會(huì)標(biāo)明收集的信息是“匿名”的,但信息越多,被對(duì)號(hào)入座的可能性就越大。已經(jīng)有研究顯示,這些收集到的移動(dòng)樣本是如此的不同,以致它們可以被用來“獨(dú)特地標(biāo)識(shí)出95%的個(gè)體”。

美國普林斯頓大學(xué)的計(jì)算機(jī)科學(xué)家納拉亞南表示,只需要33比特(二進(jìn)位制信息單位)的信息,就足以辨識(shí)出一個(gè)人的身份。

在大數(shù)據(jù)的采集和分析中,還會(huì)存在著各種偏差,哈佛商業(yè)評(píng)論博客作者凱特·克勞福德最近發(fā)表的一篇博文闡述了大數(shù)據(jù)的隱形偏差。他表示,數(shù)據(jù)和數(shù)據(jù)集本身并不是客觀的,而是由人們?cè)O(shè)計(jì)的,是人們用數(shù)據(jù)來說話,從數(shù)據(jù)進(jìn)行推斷以及解釋數(shù)據(jù)。因此在數(shù)據(jù)采集和數(shù)據(jù)分析階段,都不可避免地存在偏差。

本文來自互聯(lián)網(wǎng),僅供參考
發(fā)布:2007-04-15 10:02    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
相關(guān)軟件
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢