“全世界在經(jīng)歷第三波人工智能浪潮,這波AI新浪潮跟互聯(lián)網(wǎng)浪潮有很大不同?;ヂ?lián)網(wǎng)的重點在于商業(yè)模式的驅動,而AI則是由技術驅動的。”
在6月28日舉辦的2017商業(yè)新生態(tài)峰會上,源碼資本投資合伙人張宏江博士解析了這一波人工智能熱浪的實質,并分享了會帶來哪些挑戰(zhàn)與機會。
張宏江博士認為,人工智能技術的核心機器學習已經(jīng)從傳統(tǒng)的數(shù)學建模向依賴大數(shù)據(jù)學習轉移了。這波人工智能浪潮會帶來更多的可能,有賴于行業(yè)的大數(shù)據(jù)和AI的人才儲備,中國有望在技術上引領世界,這對于中國的創(chuàng)業(yè)公司來說是一個機會。
在AI如何影響人類的生活上,張宏江博士表示,我們應該做好準備,未來人工智能不光能夠輔助人,而且能夠代替人或者超越人,因為新的AI算法已經(jīng)具備了“上帝的視角”。而目前,凡是跟感知相關的語音識別、圖像識別,AI已經(jīng)超過了人類。凡是跟理解認知相關的,AI還是有很長的路要走。
張宏江博士還在現(xiàn)場提醒創(chuàng)業(yè)者和投資人,目前,任何一家公司都敢說自己是AI公司,所以泡沫非常非常嚴重。如果說這個公司只有算法,只有幾個牛人,沒有數(shù)據(jù)或很難拿到數(shù)據(jù)、沒有應用場景,這樣的公司做不大。
以下是張宏江博士演講實錄整理的內(nèi)容
馮總、各位嘉賓,各位早上好。非常高興今天參加這個論壇。
我想今天花點時間跟大家聊一聊這一波人工智能熱浪的實質以及會給我們帶來哪些挑戰(zhàn)與機會。
這一波人工智能的浪潮跟以前的有什么區(qū)別?我認為中國這波來人工智能的熱浪比世界上任何地方都猛。原因也許是AlphaGo第一次在圍棋上戰(zhàn)勝了人類,使得我們對人工智能刮目相看。
但我們從人工智能過去60年來的發(fā)展來看,我們今天談的人工智能的核心是人工智能的一個分支—機器學習,更具體地說是機器學習中用神經(jīng)網(wǎng)絡進行機器學習的技術,即深度學習的技術。
80年代中期到90年代初是AI的第二波浪潮,很迅速地就消失了,以至于我們很長一段時間都不好意思說自己是學人工智能的,很重要的原因是當時神經(jīng)網(wǎng)絡非常非常熱,但很快就冷下去了。原因有兩個:一是那個時候的神經(jīng)網(wǎng)絡沒有大數(shù)據(jù)的支持;二是沒有巨大的計算資源支持。
今天,我們不光有深度學習非常新的算法,更重要我們有了高質量的已標注的大數(shù)據(jù),有了非常強的計算資源,從技術上來看,今天的深度學習跟以前的人工智能的方法,尤其是與專家系統(tǒng)的方法有根本的區(qū)別。
我們今天的算法實際上是基于數(shù)據(jù)驅動的,而不是僅僅依賴于經(jīng)驗規(guī)則。
我們來看看這波AI浪潮的兩大驅動:第一:計算資源在過去30年突飛猛進。在過去的幾十年發(fā)展中,我們看到人類的超級計算機的性能的指數(shù)增長和單位價格的指數(shù)下降。第二:AI的另一重要支撐數(shù)據(jù)開始大爆發(fā)。
根據(jù)IDC的調(diào)查,整個人類所創(chuàng)造的數(shù)據(jù)在2013年至2020年間會有十倍的增長,相當于每年增長率在40%左右。我們每天所產(chǎn)生的數(shù)據(jù)已經(jīng)超過了10的19次方Byte。
今天大量的數(shù)據(jù)是由互聯(lián)網(wǎng)產(chǎn)生,這些數(shù)據(jù)不光是數(shù)據(jù)量大,而且是被標記過的,比如你的手機會記錄下你所拍的照片的時間、地點等等信息。正是因為這些數(shù)據(jù)的爆炸,使得我們能夠為人工智能提供更多更好的訓練數(shù)據(jù)。
講一個我自己的經(jīng)歷,今天的智能手機都能拍照片和識別人臉,不只是給人臉做一些美化,還能告訴你這張照片都有多少人,什么人。這是我20年前的夢想,有一個移動設備能夠告訴你拍攝的照片里面都有什么人。
經(jīng)過了20年的發(fā)展,在手機上這件事情可以做成了。為什么今天能夠做成,主要是因為剛剛提到的兩點:計算資源和大數(shù)據(jù),加上最新的學習算法。在我們90年代開始做這個題目的時候,整個的數(shù)據(jù)庫只有幾百張照片,100多個人。
五年前當谷歌、Facebook、微軟,這些工業(yè)的巨頭開始利用上百萬張、上億張照片開始訓練深層的神經(jīng)網(wǎng)絡時,用深度學習的方法來進行識別時,我們才真正的把識別率提高了,在上億張照片里準確識別出人。所以我想強調(diào)的是,當你的訓練數(shù)據(jù)規(guī)模開始呈現(xiàn)增長的時候,你的學習精度也開始有非常非常大的成長。訓練所用的資源和數(shù)據(jù)越大,訓練的精度也同樣得到線性提高。
今天這些AI公司所做的產(chǎn)品,背后所用的訓練數(shù)據(jù)已經(jīng)不是再幾千萬,而是幾億,覆蓋了面非常廣,包括不同的場景、不同的環(huán)境、不同的側面。這也是今天為什么曠視科技這樣的公司,不只是中國人臉識別技術的巨頭,也是世界人臉識別的領先者。
所以我想在這兒總結一下,這次的人工智能技術的核心在于機器學習,而機器學習已經(jīng)從經(jīng)典的理論建模往大數(shù)據(jù)驅動轉移了。
在人類的科技發(fā)展史里總是有一些先知者,今天我想跟大家介紹原來微軟研究院的一個杰出的學者Jim Gray,他十年前提出一個概念“人類科學研究的四個范式”:從一開始純粹的觀察,到牛頓的數(shù)學理論方式描述整個世界,到五六十年前開始用計算方法模擬世界,到今天第四范式用數(shù)據(jù)來驅動整體的研究。
正是因為這些技術的發(fā)展、大數(shù)據(jù)的普及,使得我們今天看到在全球各地的公司里面,已經(jīng)有很大一部分公司,開始把他們的業(yè)務建在大數(shù)據(jù)的基礎上,包括,IT公司、傳統(tǒng)制造業(yè)公司。
數(shù)據(jù)成為了我們一個新的宗教,這也是為什么像英特爾這樣做芯片的公司,在過去大手筆并購做人工智能的公司,因為數(shù)據(jù)是一個新的燃料。
剛剛談到了AI這撥的發(fā)展背后的兩大驅動力,計算和數(shù)據(jù), 下面跟大家分享一下AI的未來對于我們產(chǎn)業(yè)、對于我們生活到底有什么影響。
第一個角度是說AI能夠做的人能夠做的事情,但是會以最快的速度、更大的規(guī)模,人類能不能像AlphaGo一樣下一百萬盤棋,這是不可能的。
第二人類是否能像特斯拉那樣,每天從路上跑的幾十萬輛車里學習它們的數(shù)據(jù)。再一個就是人類能否瞬間比較出所有攝像頭拍出的人臉的數(shù)據(jù),顯然我們也不如機器。所以無論從速度上,從群體學習的能力上,還是從規(guī)模上,我們都比不上制造出來的機器。
人工智能的機器在未來不光是能夠輔助人,而且能夠代替人或者超越人,我們對這點不應該懷疑。
我們原來說機器在有邏輯的,有數(shù)學表達的應用上可能會很快超過人,代替人。是不是在人類能夠做,但是不能夠用數(shù)學公式描述出來,比如說怎么開車、怎么騎自行車、怎么畫畫,今天我們從AlphaGo的表現(xiàn)已經(jīng)很清楚的看到,正是在這些無法用數(shù)學明確的描述的場景下,機器也開始超過人了。
那么機器其實無論是在自動駕駛這塊還是在畫畫這塊,都已經(jīng)表現(xiàn)出非常出色的能力,而且柯杰在和AlphaGo下棋之后說了一句話,“人類圍棋幾千年的發(fā)展我們只看到了冰山一角,而AlphaGo則有了上帝的視角。”AlphaGo經(jīng)過了這么幾年的訓練,它爬的山比我們高得過,所以它看到整個的布局比我們廣泛得多,而我們?nèi)祟愔豢吹搅酥虚g很小一部分,相當于它具備了“上帝的視角”。
這時候我們想想AlphaGo所代表的未來,也就是說智能系統(tǒng)、智能機器,未來會超過人、替代人。其實在人類發(fā)展的歷史上,或者在整個地球發(fā)展的歷史上,我們可以看到有很多生物,當人類從一開始的猿人變成智人的時候我們的能力遠遠超過了它們,所以圖靈在很多年前就說過,說當上帝創(chuàng)造了人類之后,很多動物已經(jīng)覺得自己的命運很悲哀了。
今天當我們看到人工智能超越人類的時候,也許我們應該想一下,當初上帝創(chuàng)造了人之后,這些高級動物的感覺。今天其實我們已經(jīng)到了這種轉折點。
顯然,未來有很多行業(yè)會被AI所取代,翻譯、新聞記者的寫作、投行的分析師,今天美國政府已經(jīng)在組織一個團隊來應對未來十年中,自動駕駛取代了卡車司機后對美國就業(yè)率的沖擊。美國有800多萬人的工作與卡車相關,而整個美國的就業(yè)人口是1.2億。可見這個影響之大。
未來我們希望是從人工智能變成智能輔助,但這是我們?nèi)祟惖囊粠樵?,我們希望造出一個機器能輔助我們,而不是代替我們。實際上,我們看到的是未來AI在很多很多場景下會取代我們。
如果大家看過《人類簡史》這本書,大家喜歡這個作者的話,不妨看一下他另外一本書叫《未來簡史》,他提出了一個觀點,說未來AI的發(fā)展可能讓世界上產(chǎn)生兩種人,一種叫神人,一種叫閑人。
可怕的是神人可能只有1%,99%的閑人。當這個世界上90%的工作被計算機所取代的時候,這時候才會帶來一系列的社會問題。
也有人說有三種人可以替代AI的沖擊,一個是資本家,在座的做投資、做VC的,顯然大家不用擔心,你只要能夠融到錢,投準項目就沒錯。還有明星和手藝人。但這三種人都不會超過人口總數(shù)的1%。所以技術進步的加速給我們帶來的不光是對工作的影響,更深層次的是對文化、價值、倫理的影響,其實今天很難預測。
深度學習還有另外一個問題,就是說當它的性能不斷地提高的時候,尤其被大數(shù)據(jù)驅動的時候,我們可能不得不接受一個現(xiàn)實,很多情況下深度學習所做出的決定,它是不能夠自我解釋的。
我們還是應該清醒的認識到我們今天談的是智能的機器,而不是機器的智能,或者說機器的智能跟人的智能還是有很大的距離。今天我們看到中國市場上對于AI充滿幻想,投資方面有很多的泡沫。根本的一點就是人們沒有認清楚,到底AI今天很強的地方在哪兒,做不到的地方在哪兒。
不過,我想告訴大家,凡是跟感知相關的語音識別、圖像識別,今天的AI算法許多情況下已經(jīng)超過了人類。但凡是跟理解認知相關的,AI還是有很長的路要走。所以有任何人跟你說,他做出一個能夠模擬人類思維的AI體系,基本上就可以打一個非常大的折扣了。
既然這波AI浪潮跟以前不一樣,那么作為從業(yè)人員和投資人員,我們應該怎么來判斷AI這個機會,判斷投資機會呢?
互聯(lián)網(wǎng)女王Mary的報告有一點總結的非常好,就是說在18世紀之前農(nóng)耕社會的時候人們是靠種植收割來生存的,靠手工做的。到19世紀、20世紀工業(yè)革命的時候人們靠機器,靠工業(yè)。21世紀的話人們靠的是計算機的能力和人的能力的結合。
我們投資的時候一定要想的是,AI哪些方面,能夠讓人的潛力得到更高的發(fā)揮。過去這幾波科技浪潮,每波科技浪潮總會出現(xiàn)平臺的公司。
我們要看到哪些應用規(guī)模特別大,而它又能夠產(chǎn)生大量的數(shù)據(jù),當你有數(shù)據(jù),規(guī)模又大的時候,自然人工智能就能夠被引進來,改善整體效率,從而使得生產(chǎn)率有進一步的提高,創(chuàng)造出新的應用,從而能夠產(chǎn)生一些有規(guī)模的企業(yè)。
我們在判斷AI投資的時候有一點要想清楚:AI這波新的浪潮,跟上一波互聯(lián)網(wǎng)的浪潮有很大的不一樣?;ヂ?lián)網(wǎng)重點在于商業(yè)模式的驅動,而AI是技術驅動的。AI是從顛覆現(xiàn)有的行業(yè)開始,不是會把這個行業(yè)消失,而是讓這個行業(yè)變得非常有效,所以說和垂直的應用要結合的非常緊密。
大家做投資應該很清楚,現(xiàn)在任何一家公司都說自己是AI公司,所以泡沫非常非常嚴重。這塊我們有幾點要把握住:如果說這個公司只有算法,只有幾個牛人,沒有數(shù)據(jù)、沒有應用場景,或者說他未來依然很難拿到數(shù)據(jù)的話,這樣的公司做不大,很難持久。
在你看這些AI企業(yè)的時候,要想清楚這家公司今天有沒有數(shù)據(jù),能不能夠持續(xù)的生產(chǎn)、獲取、控制數(shù)據(jù),能不能對數(shù)據(jù)的占有程度比別人高,這些都是最根本的。只有當技術和獲取數(shù)據(jù)的能力結合的時候,它才有一個非常強的護城河。
我這兒舉個例子,大家知道今日頭條過去五年迅速的成長,背后的原因在哪兒?其實背后的原因就是解決了人們非常根本的需求,把人和信息連在一塊。我們幾千年前就以在繩子上打結的方式記錄一些事件?;钭钟∷ⅲ旒埿g出現(xiàn)以后,信息的傳遞就變得更加的方便。到了PC互聯(lián)網(wǎng)時代,我們知道互聯(lián)網(wǎng)實際上是把所有的信息連接在一起,用互聯(lián)網(wǎng)的方式呈現(xiàn)出來。
到了智能手機和移動時代,我們知道這時候你的信息終端永遠在你手上。人們獲取信息就比以前方便多了,同時也產(chǎn)生了信息爆炸。信息產(chǎn)生的速度比你看的速度快得多,這時候PC互聯(lián)網(wǎng)時代的搜索已經(jīng)變得不能夠滿足人們的需求了,你不能夠再讓人去找信息了,而是你知道這個人需要信息的時候把信息推給他。這恰恰是今日頭條的核心的商業(yè)模式,其核心是技術。今日頭條通過對人工智能的算法,通過大數(shù)據(jù)的算法,通過你手機上所產(chǎn)生的數(shù)據(jù),對你需要什么樣的信息,何時需要信息了如指掌。
今日頭條大數(shù)據(jù)的能力也非??膳拢禄钴S超過兩億,日活躍超過1億,每個人使用時長超過76分鐘。今日頭條通過技術,通過數(shù)據(jù),建立起了一個天然的屏障。在世界上所有的移動互聯(lián)網(wǎng)應用中,只有一個應用時長超過了它,那就是微信,90分鐘。
當我們意識到這波AI的潛力時,當我們知道這波AI所能帶來的價值時,我們創(chuàng)業(yè)的時候要記住三點,第一點是人工智能是我們未來的一個核心的競爭力,這點是毫無疑問的。第二個,AI的產(chǎn)業(yè)現(xiàn)在有三種模式,一個是自主開發(fā),一個是賣技術,一個是人工智能即服務。
目前大多數(shù)的公司屬于第二類,基本上就是有技術,有幾個人,這些人很強,但是沒有數(shù)據(jù),然后應用場景也不屬于他,所以基本是做咨詢服務,這不可能做到非常大的規(guī)模。
最后一點,AI是中國創(chuàng)業(yè)公司的一個機會,是中國引領世界潮流的機會。在移動互聯(lián)網(wǎng)時代,中國的微信、今日頭條,已經(jīng)在引領世界的潮流,在AI場景里,兩個競爭門檻——數(shù)據(jù)和人才,中國都是不缺的。在世界上所有的學術刊物里,中國的機器學習,尤其是深度學習,神經(jīng)網(wǎng)絡的論文作者在2014年就超過了美國。此外,在中國的已經(jīng)標注的數(shù)據(jù)量是世界上最大的,基數(shù)大,而且數(shù)據(jù)量大。