監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

霍金門徒:計算機如何比人更懂世界

申請免費試用、咨詢電話:400-8352-114

12月20日的上海,寒氣襲人,在虹橋吳中路1189號的五樓會議室,站在一塊投影屏和白板之間的Alan Yuille教授,手托腮,若有所思。在他面前的是慕名而來、經(jīng)過遴選的來自清華、浙大高校具有計算機相關(guān)背景的40多名學(xué)生。因為Alan教授在霍金的指導(dǎo)下獲得了理論物理博士學(xué)位,同時又是計算機視覺領(lǐng)域頂級學(xué)者。

  在他的學(xué)生Leo Zhu(朱瓏,依圖科技創(chuàng)始人)的邀請下,他不遠(yuǎn)萬里來到中國,開啟為期兩天的計算機視覺課程。Alan教授有著滿頭的銀絲、深陷的眼眶和蒼白的面容,看上去就像個普通的白人老者,但卻在知識的深度和廣度上異于常人—擁有數(shù)學(xué)、理論物理、計算機、心理學(xué)、精神病學(xué)和生物行為學(xué)等領(lǐng)域深厚的研究背景。

  此后,Alan教授開始將興趣轉(zhuǎn)向人工智能,主要鉆研其分支領(lǐng)域計算機視覺(Computer Vision),先后就職于MIT人工智能實驗室、哈佛大學(xué)計算機系,現(xiàn)任職于UCLA統(tǒng)計系,也是UCLA視覺識別與機器學(xué)習(xí)中心主任。三十年來,Alan教授涉足計算機視覺的學(xué)術(shù)和產(chǎn)業(yè)界,成為了首屈一指的專家。

  而此次來華,Alan教授一方面是為了向中國學(xué)生普及計算機視覺知識和行業(yè)現(xiàn)狀,另一方面也是為了支持其學(xué)生Leo的創(chuàng)業(yè)項目“依圖”—專注于視覺理解的初創(chuàng)公司,提供基于圖像理解的信息獲取和人機交互的產(chǎn)品,致力于構(gòu)建機器視覺的未來。

  由木見林看世界

  什么是計算機視覺?Alan教授在兩天的課程中都講了什么?在應(yīng)用層面,計算機視覺技術(shù)能用來做什么?

  簡單來說,計算機視覺是賦予計算機和人一般處理視覺信息的認(rèn)知能力,即制造有人類視覺能力的機器,讓計算機通過學(xué)習(xí)算法接近人類對圖像的理解程度,對明顯的視覺信息進(jìn)行深度分析。而當(dāng)計算機實現(xiàn)了對圖像和視頻的初始理解,計算機視覺就能幫助人類突破局限性,改善生活。

  不同于計算機,人類一睜眼就能迅速看到和看明白一個場景,因為人的大腦皮層至少有一半以上海量神經(jīng)元參與了視覺任務(wù)的完成。而計算機和人腦則是在極為不同的物理或生物限制下進(jìn)行運轉(zhuǎn),即便說計算機視覺理想狀態(tài)要更接近人類智慧,但在控制環(huán)境中,計算機系統(tǒng)能夠比人類更好地完成某項明確任務(wù)。

  計算機視覺的開放性任務(wù)一般包括物體檢測、人臉識別、人類行為識別和場景理解。這也是依圖正在試圖通過技術(shù)應(yīng)用解決的任務(wù)。而物體識別是計算機視覺研究的核心議題,不過當(dāng)計算機沒有學(xué)習(xí),不知道看什么的時候,顯然并不能看懂什么,所以需要一套系統(tǒng)教會計算機識別物體。

  在傳統(tǒng)物體識別系統(tǒng)中,當(dāng)計算機嘗試研究一個特殊類型的數(shù)碼圖像時,會首先檢測圖片的顯著特征,即Alan教授課堂上講述的邊緣檢測(Edge Detaction)和圖像分割(Image Segmentation)。假設(shè)系統(tǒng)需要識別人臉,就會查看眼睛、鼻子和嘴巴等器官的邊緣部分,然后確定它們之間的空間位置。

  這意味著,處理數(shù)以萬計物體的計算機系統(tǒng)將會變得不可控制的龐大。每當(dāng)計算機系統(tǒng)庫中加入一個新的物體,計算機就需要從頭開始確定物體的重要部分。而物體雖然具有固有組成部分,但不同角度物體看上去又有所不同,所以計算機需要不斷檢視邊緣確定空間位置,從而占用了大量存儲。

  而Alan教授和Leo Zhu于2010年采用新的方法解決了上述問題。他們研發(fā)的新系統(tǒng)通過遞歸式塔狀結(jié)構(gòu)來表示物體的結(jié)構(gòu)—系統(tǒng)不需要事先被告知物體的哪些特征需要尋找,會先判定細(xì)微細(xì)節(jié),由低層次的結(jié)構(gòu)組合成稍微復(fù)雜的形狀,再辨別稍復(fù)雜形狀如何組合成為更高層次部分,組裝成一個塔式結(jié)構(gòu),而最高一層則代表整個物體的模型。

  基于研究成果,Leo Zhu意識到計算機視覺逐漸達(dá)到了從理論轉(zhuǎn)化到應(yīng)用層面的階段,未來幾年將進(jìn)入技術(shù)爆發(fā)時期。2012年,他萌生了回國創(chuàng)業(yè)的想法。

  “依圖”的機器視覺

  Leo Zhu在取得導(dǎo)師Alan教授的支持后,與多年好友林晨曦(前阿里云技術(shù)總監(jiān),ACM/ICPC全球大學(xué)生程序設(shè)計競賽亞洲第一個世界冠軍團隊成員)合作創(chuàng)辦了專注于圖像理解的初創(chuàng)公司“依圖”,并把駐地設(shè)在了上海。

  目前,依圖推出的主要應(yīng)用產(chǎn)品聚焦在人臉識別和物體識別上。雖然人類希望計算機視覺接近人類智慧,不過在人臉識別上,計算機處理能力要高于人類大腦。對于這點,新浪科技有幸在依圖公司體驗了智力被碾壓的過程。

  為了讓小白更好地理解計算機如何進(jìn)行人臉識別,依圖制作了一款游戲,共20道題,每道題都選取一個人在真實環(huán)境中的頭像照片,讓參與者在五個有著相似相貌的人中選出符合的照片。因為正確選項拍攝角度不同,加上混淆選項何其相似,所以選擇起來異常費力。

  最終實驗結(jié)果證明,通過人腦判斷的正確率平均約為50%,而計算機能夠做到90%以上。對于這種虐心游戲,體驗者紛紛感嘆,對于具有臉盲癥的朋友簡直是“治療福音”。不過這只是一個游戲展示,真正的產(chǎn)品是能夠真實而快速地判定一個人的身份,可用于安防領(lǐng)域。

  在依圖這個高科技公司,門禁系統(tǒng)應(yīng)用了人臉識別技術(shù),快速匹配一個人的身份。新浪科技觀察到,員工進(jìn)門前會拿出登記認(rèn)證過的手機,選取任意角度自拍一張,如果人臉匹配,門會自動打開。依圖還有一個專門的應(yīng)用展示房間,當(dāng)每個人靠近門口時,房間內(nèi)攝像頭掃描到人的存在,會實時鎖定人臉,然后在系統(tǒng)數(shù)據(jù)庫中檢索人臉圖像進(jìn)行匹配,這一過程大概只有3到5秒。

  人臉識別的用途范圍很廣,包括公安系統(tǒng)判定犯罪嫌疑人身份、安檢系統(tǒng)確定可疑人員身份等等。目前,依圖的這項技術(shù)已經(jīng)被運用在了江蘇公安系統(tǒng)中,還將擴展到全國其他地區(qū)。最初推廣也經(jīng)歷了一些波折,依圖合伙人林晨曦表示,人們最初都覺得不新鮮,因為人臉識別技術(shù)早就應(yīng)用了,但是在精度上卻并不足夠成熟運用。

  最初Leo Zhu和依圖聯(lián)合創(chuàng)人林晨曦?fù)碛袡C器視覺技術(shù)但沒找到行業(yè)痛點,所以在推廣中也是逐漸找到了應(yīng)用場景和方向,早期得到了江蘇省公安系統(tǒng)的認(rèn)可。傳統(tǒng)的公安局人臉識別準(zhǔn)確度大約能做到40%,而車輛識別也僅限于判定車牌,無法精確到品牌、型號、購買時間和車主。 為了解決這個問題,Leo Zhu 和林晨曦首先開始搜集數(shù)據(jù)量,于是他們發(fā)動員工,一起每天在大街上抓拍車輛照片,建立數(shù)據(jù)庫。

  蘇州市公安局分管科技的副局長技的副局長陳斌華告訴他們:“如果你們車輛的品牌識別能做到70%、車輛能夠判定出型號,我們就考慮使用你們的產(chǎn)品。”對于這個難點,依圖的員工不分晝夜花了三個月時間終于攻克,僅是對桑塔納的識別正確率就超過了90%。

  通過這套“蜻蜓眼”系統(tǒng),蘇州公安可以準(zhǔn)確進(jìn)行車牌識別和車型識別, 具備了應(yīng)用計算機自動發(fā)現(xiàn)在路面行駛的假套牌車輛的能力,這在全國公安屬于首創(chuàng)。 經(jīng)過了一年的數(shù)據(jù)積累和系統(tǒng)改進(jìn),原來針對套牌作案車輛需要花至少3到4小時才能完成的甄別工作,現(xiàn)在只需要十多分鐘。

  就在不久前,蘇州公安以此為突破口,迅速摧毀了一個專門盜竊出租車頂燈、計價器的犯罪團伙,極大提高了工作效率。目前,依圖能夠?qū)崿F(xiàn)對運行中被捕捉在鏡頭中的所有車輛進(jìn)行品牌、型號、購買時間和車牌號真假的鑒定等。隨后,福建和成都等公安系統(tǒng)也開展了與依圖的合作。

  不過比起人臉識別, 簡單剛性物體識別的技術(shù)門檻要相對低一些,因為物體不會像人臉一樣會形成不同角度和不同狀態(tài)的形狀扭曲。而在這個難題上,依圖已經(jīng)做到了在一億人中進(jìn)行人臉識別靜態(tài)比對。

  在人臉識別應(yīng)用上,依圖與蘇州市局合作開發(fā)了靜態(tài)人像比對系統(tǒng)。今年7月,依圖將在逃人員照片庫與蘇州公安人像庫進(jìn)行批量對比,發(fā)現(xiàn)25名在蘇州有活動的在逃人員線索信息。目前,青奧會安保系統(tǒng),珠海航展安保系統(tǒng)也已相繼成功應(yīng)用了依圖的人臉識別產(chǎn)品。

  依圖的發(fā)展方向并不是只開發(fā)安防產(chǎn)品,而是創(chuàng)建一個在計算機視覺領(lǐng)域具有國際前沿地位的技術(shù)研發(fā)平臺。未來,依圖還將從人臉和物體識別延展到人的肢體和服飾識別上。比如幫助用戶判定路人甲身上所穿衣服的品牌,而這又要用到增強現(xiàn)實技術(shù),需要軟硬件完美結(jié)合。

  對于計算機視覺下一步能夠做什么,在從業(yè)者看來都是未知數(shù),因為技術(shù)演進(jìn)速度超出想象,現(xiàn)在設(shè)限并不合適。

  從學(xué)術(shù)界到產(chǎn)業(yè)界

  對于計算機視覺的研究領(lǐng)域,在近五年來都處于快速發(fā)展的關(guān)鍵階段,學(xué)術(shù)研究在近兩年得到了巨大進(jìn)展,而在應(yīng)用領(lǐng)域在未來一到兩年將進(jìn)入集中爆發(fā)的階段。

  根據(jù)美國國家科學(xué)基金會白皮書,計算機視覺興起于二十世紀(jì)六七十年代,而在進(jìn)入2010年以來,計算機視覺主要面臨兩個問題,一是由于該領(lǐng)域與計算機、工程學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、心理學(xué)與神經(jīng)學(xué)科等有著跨學(xué)科緊密聯(lián)系,但受限于領(lǐng)域通是常一種分裂研究的狀態(tài);二是通常該領(lǐng)域的研究是以非結(jié)構(gòu)化的方式進(jìn)行,故學(xué)術(shù)界與工業(yè)界之間聯(lián)系并不緊密,互動不多。

  在地域上,根據(jù)白皮書顯示,1991年計算機視覺研究由美國主導(dǎo),在歐洲的活動數(shù)量有限,在亞洲就更是少之又少。而在過去二十年里,美國的計算機視覺有穩(wěn)定的發(fā)展,而在歐洲卻發(fā)生不容小覷的擴張。近年來,在亞洲更是取得了巨大的突破。很大程度上,亞洲和歐洲在這一領(lǐng)域的發(fā)展都是由強大的資金支持推動的。即使在美國,大多數(shù)研究者都是非本土出生的。

  而計算機視覺的發(fā)展,主要得益于計算機、傳感技術(shù)和數(shù)學(xué)等學(xué)科的發(fā)展。在計算機視覺專家E·艾德森看來,進(jìn)步即將發(fā)生在于“人們正在學(xué)習(xí)如何適當(dāng)使用應(yīng)用數(shù)學(xué)與工程解決視覺問題。人們在控制理論、優(yōu)化問題、信號處理等方面正變得更加擅長。”

  而現(xiàn)在,學(xué)術(shù)界和工業(yè)界的聯(lián)系愈來愈緊密,從理論到現(xiàn)實的差距大為縮小。Alan教授說,特別是這五年來,很多工作越來越實際,美國科技公司比如微軟、Facebook、谷歌、亞馬遜和百度等,都在人工智能領(lǐng)域做實際工作,“我非常高興看到這些進(jìn)展,因為我們最后還是希望能夠轉(zhuǎn)化為實用產(chǎn)品。”

  這也是為何依圖選擇在這個時間點切入從事計算機視覺的應(yīng)用研究。Leo Zhu表示:“其實沒有人確切知道現(xiàn)實和理論有多大距離,未來兩年技術(shù)是比較大的爆發(fā)時期,這是我們預(yù)見的事情,所以這是我們?yōu)槭裁匆鲞@個事情。”他說道,“以前大家都知道計算機視覺是未來,但不知道什么時候會來,但我們有具體意義上的推導(dǎo),所以決定2012年開始,以及現(xiàn)在正在做這件事。”

  作為Alan教授的學(xué)生,Leo Zhu自然具有強硬的學(xué)術(shù)背景,而他并沒有繼續(xù)做研究,而是回國創(chuàng)業(yè)。Leo Zhu希望將計算機視覺作為終身事業(yè),但作為學(xué)院派研究者只能通過自己的學(xué)生傳承知識,而回國創(chuàng)業(yè)將理論轉(zhuǎn)化為實際應(yīng)用,并推動國內(nèi)相關(guān)領(lǐng)域的發(fā)展,是他更傾向于走的一條道路。

  Alan教授說責(zé)無旁貸地支持Leo Zhu的選擇:“現(xiàn)在跟十年前不太一樣了。十年前有很多學(xué)生要做教授,而過去五年來情況已經(jīng)變了。我最好的這些學(xué)生都想創(chuàng)業(yè),而計算機視覺是一個很好的領(lǐng)域,現(xiàn)在也是一個很好的時機。”他解釋道,過去的學(xué)術(shù)成果距離解決實際問題還有一定的距離,但近來學(xué)術(shù)有重大進(jìn)展,在實際中也將發(fā)揮巨大作用。

  Alan教授和霍金

  Alan教授感知到學(xué)術(shù)界和產(chǎn)業(yè)界互相推進(jìn)的必要性,以及在中國的巨大增長潛力,于是他此次專程來滬與中國學(xué)生進(jìn)行交流。而在兩天的課程中,教授一直處于連續(xù)不間斷講課的狀態(tài),他說這也是他第一次長時間授課的經(jīng)歷。

  不過,盡管Alan教授連續(xù)講課口干舌燥,課間也要接受同學(xué)的提問,但是他仍然耐心有加、有條不紊,和藹紳士的態(tài)度讓人肅然起敬。而除了計算機視覺的理論框架之外,他還回憶了自己的學(xué)術(shù)經(jīng)歷,與學(xué)生探討科學(xué)研究的方法,以及講述了他在研究生涯的心得體會。

  在師從霍金時候,Alan教授在研究相對論和量子物理,前者是在宏觀范疇中描述結(jié)構(gòu),而后者則是在微觀中研究。而他是霍金的第二個研究該課題希望統(tǒng)一兩個理論的學(xué)生。“這個是有一點抽象的課題,想要把這兩個理論統(tǒng)一到一起,的確是非常難,就算是30年后的今天似乎也沒有人做的特別成功。”

  在接受新浪科技采訪時,Alan教授分享了與導(dǎo)師霍金的一些故事。他說,霍金是一個非常風(fēng)趣幽默的人,有時會操縱他的輪椅,在房間里轉(zhuǎn)圈圈玩。平時Alan教授作為學(xué)生會和霍金有比較近的聯(lián)系,有時候會幫他做一些事情,包括喂他吃東西之類的。在霍金比較有名了之后,很多科學(xué)家都會慕名前來看望他,教授會在旁邊聽,同時也會經(jīng)常見到他的家人,一起吃午飯和照看他的孩子。

  今年下半年,電影《萬物理論》上映,講述了講述霍金盧伽雷氏癥病情發(fā)作前的生活與妻子之間的故事。Alan教授說:“這是基于他的太太寫的書,故事看起來都還挺真實的,特別是演霍金的這個演員,長相和聲音和霍金一模一樣,我會覺得,霍金就是在銀屏上面。但是其他的人就不像我認(rèn)識的人,所以我感到有點奇怪,就像是一群陌生人圍著他在干些什么。”說著他笑了起來。


  而今年來,霍金對于人工智能發(fā)展也敲了不少警鐘。他警告稱,人類正面臨來自智能技術(shù)的威脅,隨著技術(shù)體自身開始學(xué)會自我思考,并學(xué)會適應(yīng)環(huán)境,人類將面對不確定的未來?;艚鸨硎荆?ldquo;如果進(jìn)一步向前看,技術(shù)幾乎是沒有極限的。盡管我們可能正面臨人類歷史上最好或最壞的時代,而我們所有人都應(yīng)該問問自己,應(yīng)該做些什么才能最終趨利避害。”

  對此,在Alan看來:“記得大概30年前,霍金成為盧卡斯物理教授(Lucasian Professor這是愛因斯坦和牛頓都曾有過的一個頭銜)時,他做了一個演講,解決了理論物理以后,結(jié)果是機器可能會淘汰這些物理學(xué)家。我想霍金可能30年以來都一直有這個顧慮,并不是現(xiàn)在AI(人工智能)的興起才有這個顧慮,或許我下周寫封信問問他這個問題。”

  對于計算機視覺的未來,Alan教授認(rèn)為,終極目標(biāo)當(dāng)然是建立一個智能的系統(tǒng),能夠像人一樣看懂這個世界,也可能能力上超越人類,比人類更能看懂這個世界。因為大腦神經(jīng)元主要用來處理視覺,所以通過視覺能夠了解人腦。而未來人類能夠通過計算機更加理解人腦,看懂我們存在的世界。

         

發(fā)布:2007-03-12 14:33    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普人力資源管理軟件其他應(yīng)用

工資軟件 人力資源管理軟件 人力資源管理系統(tǒng) 人力資源管理信息系統(tǒng) 人事檔案管理系統(tǒng) 人事管理系統(tǒng) 人事軟件 工資管理系統(tǒng) 工資管理軟件 員工工資管理系統(tǒng) 制作工資表軟件 工資核算軟件 人員管理軟件 績效管理系統(tǒng) 招聘管理系統(tǒng) 檔案管理軟件 考勤管理軟件 考勤管理系統(tǒng)