人力資源管理軟件

當(dāng)前位置：工程項目OA系統(tǒng) > 領(lǐng)域應(yīng)用 > 人力資源管理系統(tǒng) > 人力資源管理軟件

霍金門徒：計算機如何比人更懂世界

12月20日的上海，寒氣襲人，在虹橋吳中路1189號的五樓會議室，站在一塊投影屏和白板之間的Alan Yuille教授，手托腮，若有所思。在他面前的是慕名而來、經(jīng)過遴選的來自清華、浙大高校具有計算機相關(guān)背景的40多名學(xué)生。因為Alan教授在霍金的指導(dǎo)下獲得了理論物理博士學(xué)位，同時又是計算機視覺領(lǐng)域頂級學(xué)者。

　　在他的學(xué)生Leo Zhu(朱瓏，依圖科技創(chuàng)始人)的邀請下，他不遠萬里來到中國，開啟為期兩天的計算機視覺課程。Alan教授有著滿頭的銀絲、深陷的眼眶和蒼白的面容，看上去就像個普通的白人老者，但卻在知識的深度和廣度上異于常人—擁有數(shù)學(xué)、理論物理、計算機、心理學(xué)、精神病學(xué)和生物行為學(xué)等領(lǐng)域深厚的研究背景。

　　此后，Alan教授開始將興趣轉(zhuǎn)向人工智能，主要鉆研其分支領(lǐng)域計算機視覺(Computer Vision)，先后就職于MIT人工智能實驗室、哈佛大學(xué)計算機系，現(xiàn)任職于UCLA統(tǒng)計系，也是UCLA視覺識別與機器學(xué)習(xí)中心主任。三十年來，Alan教授涉足計算機視覺的學(xué)術(shù)和產(chǎn)業(yè)界，成為了首屈一指的專家。

　　而此次來華，Alan教授一方面是為了向中國學(xué)生普及計算機視覺知識和行業(yè)現(xiàn)狀，另一方面也是為了支持其學(xué)生Leo的創(chuàng)業(yè)項目“依圖”—專注于視覺理解的初創(chuàng)公司，提供基于圖像理解的信息獲取和人機交互的產(chǎn)品，致力于構(gòu)建機器視覺的未來。

　　由木見林看世界

　　什么是計算機視覺？Alan教授在兩天的課程中都講了什么？在應(yīng)用層面，計算機視覺技術(shù)能用來做什么？

　　簡單來說，計算機視覺是賦予計算機和人一般處理視覺信息的認知能力，即制造有人類視覺能力的機器，讓計算機通過學(xué)習(xí)算法接近人類對圖像的理解程度，對明顯的視覺信息進行深度分析。而當(dāng)計算機實現(xiàn)了對圖像和視頻的初始理解，計算機視覺就能幫助人類突破局限性，改善生活。

　　不同于計算機，人類一睜眼就能迅速看到和看明白一個場景，因為人的大腦皮層至少有一半以上海量神經(jīng)元參與了視覺任務(wù)的完成。而計算機和人腦則是在極為不同的物理或生物限制下進行運轉(zhuǎn)，即便說計算機視覺理想狀態(tài)要更接近人類智慧，但在控制環(huán)境中，計算機系統(tǒng)能夠比人類更好地完成某項明確任務(wù)。

　　計算機視覺的開放性任務(wù)一般包括物體檢測、人臉識別、人類行為識別和場景理解。這也是依圖正在試圖通過技術(shù)應(yīng)用解決的任務(wù)。而物體識別是計算機視覺研究的核心議題，不過當(dāng)計算機沒有學(xué)習(xí)，不知道看什么的時候，顯然并不能看懂什么，所以需要一套系統(tǒng)教會計算機識別物體。

　　在傳統(tǒng)物體識別系統(tǒng)中，當(dāng)計算機嘗試研究一個特殊類型的數(shù)碼圖像時，會首先檢測圖片的顯著特征，即Alan教授課堂上講述的邊緣檢測(Edge Detaction)和圖像分割(Image Segmentation)。假設(shè)系統(tǒng)需要識別人臉，就會查看眼睛、鼻子和嘴巴等器官的邊緣部分，然后確定它們之間的空間位置。

　　這意味著，處理數(shù)以萬計物體的計算機系統(tǒng)將會變得不可控制的龐大。每當(dāng)計算機系統(tǒng)庫中加入一個新的物體，計算機就需要從頭開始確定物體的重要部分。而物體雖然具有固有組成部分，但不同角度物體看上去又有所不同，所以計算機需要不斷檢視邊緣確定空間位置，從而占用了大量存儲。

　　而Alan教授和Leo Zhu于2010年采用新的方法解決了上述問題。他們研發(fā)的新系統(tǒng)通過遞歸式塔狀結(jié)構(gòu)來表示物體的結(jié)構(gòu)—系統(tǒng)不需要事先被告知物體的哪些特征需要尋找，會先判定細微細節(jié)，由低層次的結(jié)構(gòu)組合成稍微復(fù)雜的形狀，再辨別稍復(fù)雜形狀如何組合成為更高層次部分，組裝成一個塔式結(jié)構(gòu)，而最高一層則代表整個物體的模型。

　　基于研究成果，Leo Zhu意識到計算機視覺逐漸達到了從理論轉(zhuǎn)化到應(yīng)用層面的階段，未來幾年將進入技術(shù)爆發(fā)時期。2012年，他萌生了回國創(chuàng)業(yè)的想法。

　　“依圖”的機器視覺

　　Leo Zhu在取得導(dǎo)師Alan教授的支持后，與多年好友林晨曦(前阿里云技術(shù)總監(jiān)，ACM/ICPC全球大學(xué)生程序設(shè)計競賽亞洲第一個世界冠軍團隊成員)合作創(chuàng)辦了專注于圖像理解的初創(chuàng)公司“依圖”，并把駐地設(shè)在了上海。

　　目前，依圖推出的主要應(yīng)用產(chǎn)品聚焦在人臉識別和物體識別上。雖然人類希望計算機視覺接近人類智慧，不過在人臉識別上，計算機處理能力要高于人類大腦。對于這點，新浪科技有幸在依圖公司體驗了智力被碾壓的過程。

　　為了讓小白更好地理解計算機如何進行人臉識別，依圖制作了一款游戲，共20道題，每道題都選取一個人在真實環(huán)境中的頭像照片，讓參與者在五個有著相似相貌的人中選出符合的照片。因為正確選項拍攝角度不同，加上混淆選項何其相似，所以選擇起來異常費力。

　　最終實驗結(jié)果證明，通過人腦判斷的正確率平均約為50%，而計算機能夠做到90%以上。對于這種虐心游戲，體驗者紛紛感嘆，對于具有臉盲癥的朋友簡直是“治療福音”。不過這只是一個游戲展示，真正的產(chǎn)品是能夠真實而快速地判定一個人的身份，可用于安防領(lǐng)域。

　　在依圖這個高科技公司，門禁系統(tǒng)應(yīng)用了人臉識別技術(shù)，快速匹配一個人的身份。新浪科技觀察到，員工進門前會拿出登記認證過的手機，選取任意角度自拍一張，如果人臉匹配，門會自動打開。依圖還有一個專門的應(yīng)用展示房間，當(dāng)每個人靠近門口時，房間內(nèi)攝像頭掃描到人的存在，會實時鎖定人臉，然后在系統(tǒng)數(shù)據(jù)庫中檢索人臉圖像進行匹配，這一過程大概只有3到5秒。

　　人臉識別的用途范圍很廣，包括公安系統(tǒng)判定犯罪嫌疑人身份、安檢系統(tǒng)確定可疑人員身份等等。目前，依圖的這項技術(shù)已經(jīng)被運用在了江蘇公安系統(tǒng)中，還將擴展到全國其他地區(qū)。最初推廣也經(jīng)歷了一些波折，依圖合伙人林晨曦表示，人們最初都覺得不新鮮，因為人臉識別技術(shù)早就應(yīng)用了，但是在精度上卻并不足夠成熟運用。

　　最初Leo Zhu和依圖聯(lián)合創(chuàng)人林晨曦擁有機器視覺技術(shù)但沒找到行業(yè)痛點，所以在推廣中也是逐漸找到了應(yīng)用場景和方向，早期得到了江蘇省公安系統(tǒng)的認可。傳統(tǒng)的公安局人臉識別準(zhǔn)確度大約能做到40%，而車輛識別也僅限于判定車牌，無法精確到品牌、型號、購買時間和車主。為了解決這個問題，Leo Zhu 和林晨曦首先開始搜集數(shù)據(jù)量，于是他們發(fā)動員工，一起每天在大街上抓拍車輛照片，建立數(shù)據(jù)庫。

　　蘇州市公安局分管科技的副局長技的副局長陳斌華告訴他們：“如果你們車輛的品牌識別能做到70%、車輛能夠判定出型號，我們就考慮使用你們的產(chǎn)品。”對于這個難點，依圖的員工不分晝夜花了三個月時間終于攻克，僅是對桑塔納的識別正確率就超過了90%。

　　通過這套“蜻蜓眼”系統(tǒng)，蘇州公安可以準(zhǔn)確進行車牌識別和車型識別，具備了應(yīng)用計算機自動發(fā)現(xiàn)在路面行駛的假套牌車輛的能力，這在全國公安屬于首創(chuàng)。經(jīng)過了一年的數(shù)據(jù)積累和系統(tǒng)改進，原來針對套牌作案車輛需要花至少3到4小時才能完成的甄別工作，現(xiàn)在只需要十多分鐘。

　　就在不久前，蘇州公安以此為突破口，迅速摧毀了一個專門盜竊出租車頂燈、計價器的犯罪團伙，極大提高了工作效率。目前，依圖能夠?qū)崿F(xiàn)對運行中被捕捉在鏡頭中的所有車輛進行品牌、型號、購買時間和車牌號真假的鑒定等。隨后，福建和成都等公安系統(tǒng)也開展了與依圖的合作。

　　不過比起人臉識別，簡單剛性物體識別的技術(shù)門檻要相對低一些，因為物體不會像人臉一樣會形成不同角度和不同狀態(tài)的形狀扭曲。而在這個難題上，依圖已經(jīng)做到了在一億人中進行人臉識別靜態(tài)比對。

　　在人臉識別應(yīng)用上，依圖與蘇州市局合作開發(fā)了靜態(tài)人像比對系統(tǒng)。今年7月，依圖將在逃人員照片庫與蘇州公安人像庫進行批量對比，發(fā)現(xiàn)25名在蘇州有活動的在逃人員線索信息。目前，青奧會安保系統(tǒng)，珠海航展安保系統(tǒng)也已相繼成功應(yīng)用了依圖的人臉識別產(chǎn)品。

　　依圖的發(fā)展方向并不是只開發(fā)安防產(chǎn)品，而是創(chuàng)建一個在計算機視覺領(lǐng)域具有國際前沿地位的技術(shù)研發(fā)平臺。未來，依圖還將從人臉和物體識別延展到人的肢體和服飾識別上。比如幫助用戶判定路人甲身上所穿衣服的品牌，而這又要用到增強現(xiàn)實技術(shù)，需要軟硬件完美結(jié)合。

　　對于計算機視覺下一步能夠做什么，在從業(yè)者看來都是未知數(shù)，因為技術(shù)演進速度超出想象，現(xiàn)在設(shè)限并不合適。

　　從學(xué)術(shù)界到產(chǎn)業(yè)界

　　對于計算機視覺的研究領(lǐng)域，在近五年來都處于快速發(fā)展的關(guān)鍵階段，學(xué)術(shù)研究在近兩年得到了巨大進展，而在應(yīng)用領(lǐng)域在未來一到兩年將進入集中爆發(fā)的階段。

　　根據(jù)美國國家科學(xué)基金會白皮書，計算機視覺興起于二十世紀(jì)六七十年代，而在進入2010年以來，計算機視覺主要面臨兩個問題，一是由于該領(lǐng)域與計算機、工程學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、心理學(xué)與神經(jīng)學(xué)科等有著跨學(xué)科緊密聯(lián)系，但受限于領(lǐng)域通是常一種分裂研究的狀態(tài)；二是通常該領(lǐng)域的研究是以非結(jié)構(gòu)化的方式進行，故學(xué)術(shù)界與工業(yè)界之間聯(lián)系并不緊密，互動不多。

　　在地域上，根據(jù)白皮書顯示，1991年計算機視覺研究由美國主導(dǎo)，在歐洲的活動數(shù)量有限，在亞洲就更是少之又少。而在過去二十年里，美國的計算機視覺有穩(wěn)定的發(fā)展，而在歐洲卻發(fā)生不容小覷的擴張。近年來，在亞洲更是取得了巨大的突破。很大程度上，亞洲和歐洲在這一領(lǐng)域的發(fā)展都是由強大的資金支持推動的。即使在美國，大多數(shù)研究者都是非本土出生的。

　　而計算機視覺的發(fā)展，主要得益于計算機、傳感技術(shù)和數(shù)學(xué)等學(xué)科的發(fā)展。在計算機視覺專家E·艾德森看來，進步即將發(fā)生在于“人們正在學(xué)習(xí)如何適當(dāng)使用應(yīng)用數(shù)學(xué)與工程解決視覺問題。人們在控制理論、優(yōu)化問題、信號處理等方面正變得更加擅長。”

　　而現(xiàn)在，學(xué)術(shù)界和工業(yè)界的聯(lián)系愈來愈緊密，從理論到現(xiàn)實的差距大為縮小。Alan教授說，特別是這五年來，很多工作越來越實際，美國科技公司比如微軟、Facebook、谷歌、亞馬遜和百度等，都在人工智能領(lǐng)域做實際工作，“我非常高興看到這些進展，因為我們最后還是希望能夠轉(zhuǎn)化為實用產(chǎn)品。”

　　這也是為何依圖選擇在這個時間點切入從事計算機視覺的應(yīng)用研究。Leo Zhu表示：“其實沒有人確切知道現(xiàn)實和理論有多大距離，未來兩年技術(shù)是比較大的爆發(fā)時期，這是我們預(yù)見的事情，所以這是我們?yōu)槭裁匆鲞@個事情。”他說道，“以前大家都知道計算機視覺是未來，但不知道什么時候會來，但我們有具體意義上的推導(dǎo)，所以決定2012年開始，以及現(xiàn)在正在做這件事。”

　　作為Alan教授的學(xué)生，Leo Zhu自然具有強硬的學(xué)術(shù)背景，而他并沒有繼續(xù)做研究，而是回國創(chuàng)業(yè)。Leo Zhu希望將計算機視覺作為終身事業(yè)，但作為學(xué)院派研究者只能通過自己的學(xué)生傳承知識，而回國創(chuàng)業(yè)將理論轉(zhuǎn)化為實際應(yīng)用，并推動國內(nèi)相關(guān)領(lǐng)域的發(fā)展，是他更傾向于走的一條道路。

　　Alan教授說責(zé)無旁貸地支持Leo Zhu的選擇：“現(xiàn)在跟十年前不太一樣了。十年前有很多學(xué)生要做教授，而過去五年來情況已經(jīng)變了。我最好的這些學(xué)生都想創(chuàng)業(yè)，而計算機視覺是一個很好的領(lǐng)域，現(xiàn)在也是一個很好的時機。”他解釋道，過去的學(xué)術(shù)成果距離解決實際問題還有一定的距離，但近來學(xué)術(shù)有重大進展，在實際中也將發(fā)揮巨大作用。

　　Alan教授和霍金

　　Alan教授感知到學(xué)術(shù)界和產(chǎn)業(yè)界互相推進的必要性，以及在中國的巨大增長潛力，于是他此次專程來滬與中國學(xué)生進行交流。而在兩天的課程中，教授一直處于連續(xù)不間斷講課的狀態(tài)，他說這也是他第一次長時間授課的經(jīng)歷。

　　不過，盡管Alan教授連續(xù)講課口干舌燥，課間也要接受同學(xué)的提問，但是他仍然耐心有加、有條不紊，和藹紳士的態(tài)度讓人肅然起敬。而除了計算機視覺的理論框架之外，他還回憶了自己的學(xué)術(shù)經(jīng)歷，與學(xué)生探討科學(xué)研究的方法，以及講述了他在研究生涯的心得體會。

　　在師從霍金時候，Alan教授在研究相對論和量子物理，前者是在宏觀范疇中描述結(jié)構(gòu)，而后者則是在微觀中研究。而他是霍金的第二個研究該課題希望統(tǒng)一兩個理論的學(xué)生。“這個是有一點抽象的課題，想要把這兩個理論統(tǒng)一到一起，的確是非常難，就算是30年后的今天似乎也沒有人做的特別成功。”

　　在接受新浪科技采訪時，Alan教授分享了與導(dǎo)師霍金的一些故事。他說，霍金是一個非常風(fēng)趣幽默的人，有時會操縱他的輪椅，在房間里轉(zhuǎn)圈圈玩。平時Alan教授作為學(xué)生會和霍金有比較近的聯(lián)系，有時候會幫他做一些事情，包括喂他吃東西之類的。在霍金比較有名了之后，很多科學(xué)家都會慕名前來看望他，教授會在旁邊聽，同時也會經(jīng)常見到他的家人，一起吃午飯和照看他的孩子。

　　今年下半年，電影《萬物理論》上映，講述了講述霍金盧伽雷氏癥病情發(fā)作前的生活與妻子之間的故事。Alan教授說：“這是基于他的太太寫的書，故事看起來都還挺真實的，特別是演霍金的這個演員，長相和聲音和霍金一模一樣，我會覺得，霍金就是在銀屏上面。但是其他的人就不像我認識的人，所以我感到有點奇怪，就像是一群陌生人圍著他在干些什么。”說著他笑了起來。

　　而今年來，霍金對于人工智能發(fā)展也敲了不少警鐘。他警告稱，人類正面臨來自智能技術(shù)的威脅，隨著技術(shù)體自身開始學(xué)會自我思考，并學(xué)會適應(yīng)環(huán)境，人類將面對不確定的未來?；艚鸨硎荆?ldquo;如果進一步向前看，技術(shù)幾乎是沒有極限的。盡管我們可能正面臨人類歷史上最好或最壞的時代，而我們所有人都應(yīng)該問問自己，應(yīng)該做些什么才能最終趨利避害。”

　　對此，在Alan看來：“記得大概30年前，霍金成為盧卡斯物理教授(Lucasian Professor這是愛因斯坦和牛頓都曾有過的一個頭銜)時，他做了一個演講，解決了理論物理以后，結(jié)果是機器可能會淘汰這些物理學(xué)家。我想霍金可能30年以來都一直有這個顧慮，并不是現(xiàn)在AI(人工智能)的興起才有這個顧慮，或許我下周寫封信問問他這個問題。”

　　對于計算機視覺的未來，Alan教授認為，終極目標(biāo)當(dāng)然是建立一個智能的系統(tǒng)，能夠像人一樣看懂這個世界，也可能能力上超越人類，比人類更能看懂這個世界。因為大腦神經(jīng)元主要用來處理視覺，所以通過視覺能夠了解人腦。而未來人類能夠通過計算機更加理解人腦，看懂我們存在的世界。

發(fā)布：2007-03-12 14:33 編輯：泛普軟件 · xiaona [打印此頁] [關(guān)閉]

相關(guān)欄目：

下一篇：數(shù)據(jù)和軟件到底誰在主導(dǎo)互聯(lián)網(wǎng)世界

人力資源管理系統(tǒng)

聯(lián)系方式

成都公司：成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司：重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢：400-8352-114

加微信，免費獲取試用系統(tǒng)

QQ在線咨詢

電話咨詢：
4008352114

QQ在線咨詢

霍金門徒：計算機如何比人更懂世界

泛普人力資源管理軟件其他應(yīng)用