首頁

智能語音融合通信

商湯科技CEO徐立：讓AI產(chǎn)業(yè)化落地，還要靠這雙輪驅動？

2018-01-30 10:35:20 來源：搜狐科技熱度:

目前，人工智能浪潮的興起與很多科學家創(chuàng)業(yè)有很大關系，從某種意義上，這是一種科學產(chǎn)業(yè)。但這只是最近幾年才發(fā)生的。

在我讀書的時候，有一個段子：我們要去讀博士，很多海外名校教授說，其實讀博士不是一個致富的路徑，一般是有錢了再去讀博士、做科學家，與做科學家是為了有錢，這兩個邏輯是反的。

還有一個事實是，在中世紀，基本上只有貴族才能做真正的科學研究，因為科學和產(chǎn)業(yè)之間的矛盾和沖突非常大，它們是兩個截然不同的點。

我們定義了科學家：認真做科學研究，專注于技術、基礎理論的突破。

從100 年前到現(xiàn)在，很多時候，很多理論得到了創(chuàng)新和發(fā)展，但是真正意義上能夠和產(chǎn)業(yè)結合的很少，我們大家耳熟能詳各種各樣的科學家，但科學真正意義上的成功，都與最后的產(chǎn)業(yè)落地相距較遠，產(chǎn)業(yè)關注什么事情？

關注真正的盈利能力、標準化、快速變現(xiàn)、解決方案……真正的產(chǎn)業(yè)，實際上來自于市場的需求。

所以，科學和產(chǎn)業(yè)還是背道而馳的，完全不一樣的概念。但現(xiàn)在這個階段，這兩條線似乎走到了交叉路口。那么，到底什么事情使得科學和產(chǎn)業(yè)能夠交匯在一起？

我覺得很關鍵的一點是，科學和產(chǎn)業(yè)的交匯點是雙輪驅動的。

一、雙輪驅動科學與產(chǎn)業(yè)交匯

什么是雙輪驅動？

第一，技術突破是增量性的。

通常情況下，技術核心突破來得快一點，而科學發(fā)展會有幾年是平穩(wěn)的，也就是說，理論研究非常重要，但是未必能夠真正被應用到我們認為的、認知的商業(yè)上去。

而科技有時是跳躍式發(fā)展的，它不是直線性、增量性的。

比如說，人工智能的這一輪突破，從某種意義上，就是把傳統(tǒng)的人工指導的智能，轉化成純數(shù)據(jù)驅動的智能，包括我們現(xiàn)在耳熟能詳?shù)纳疃葘W習、基于深度學習的純數(shù)據(jù)驅動方法在內，都是顛覆式的變化，而不是一個增量式的變化。

也只有在這種狀態(tài)下，才能夠帶來完全不同的新生產(chǎn)力。

第二，產(chǎn)業(yè)需要具備怎樣的條件？

剛才我舉例說，目前的人工智能是顛覆式的科技發(fā)展，其實這樣顛覆性的發(fā)展在歷史上也發(fā)生過，比如一些新材料、新能源的發(fā)現(xiàn)，但是它們在真正意義上未必等價于能進行產(chǎn)業(yè)變現(xiàn)與變化。

例如鎢絲，發(fā)現(xiàn)很久了，但真正被用到燈泡里作為一個燈，需要從現(xiàn)實的場景倒推到材料的突破和材料的革命，這是一個非常重要的點。（筆記書堂推薦《我們如何走到今天·重塑世界的6項創(chuàng)新》，書中集中講述了科技發(fā)明史中成功變化為產(chǎn)業(yè)的6項發(fā)明。文末有售。）

那么，從產(chǎn)業(yè)界角度，到底什么是重要的呢？

二、科技的產(chǎn)業(yè)現(xiàn)狀與發(fā)展

從產(chǎn)業(yè)的角度，在于產(chǎn)業(yè)的需求是否在真正意義上到達了爆發(fā)的臨界點，也就是大眾是否已經(jīng)被足夠好的教育過了，這個科學技術是否已經(jīng)可以普羅大眾。

因為，科技進步能夠帶來的是顛覆式的勞動力、生產(chǎn)力；同時，如果市場被教育了，能夠帶來的是被大家認知的需求。

有了這兩樣要素，我們就覺得科學技術的推進與產(chǎn)業(yè)的變化能夠合在一起了，可以引領人類進步、改變人類生活。

商湯科技關注的是計算機視覺、人工智能眼睛的部分。我們希望能夠幫人看清、看懂這個世界，從這個角度來講，科學家到底在做什么？

未來，科學家的延展方向很大程度上在于感知層面。

我們能否知道、看清核心與本質，在于是否有更好的感知能力，而感知的能力不僅可以從硬件的角度突破，算法、理論，以及背后的支撐都可以帶來突破感知能力核心的機會。

從之前到現(xiàn)在，大部分的感受器處理的都是可見光，這一兩年，感受器在視覺領域已經(jīng)從可見光轉到了不可見光，我們可以有 UV 攝像頭，可以有遠紅外、近紅外攝像頭，甚至還有各種熱敏攝像頭，打開了一個完全不一樣的應用范疇。

舉個例子：

iPhone X 支持人臉解鎖或支付，就是感知能力從可見光轉到近紅外的體現(xiàn)。

在近紅外的情況下，我們可以做到更好地識別真人、更好地驗證，所以給真正的支付，也就是打通線上線下場景起到了保駕護航作用。

我們還可以看到，現(xiàn)在路面上的攝像頭也很多，很多人認為到了晚上攝像頭就看不到了，實際上攝像頭的感知能力已經(jīng)達到了星光級，甚至是極光級了，也就是在非常黑的情況下都可以有非常完美的成像。

地上的攝像頭如此，天上的攝像頭也是如此（此處指遙感相關設備）。

商湯科技一直認為，目前來看，行業(yè)發(fā)展空間最大的是地面攝像頭的應用，但是未來，天上的攝像頭越來越多的情況下，大家都會面臨同樣的處理數(shù)據(jù)問題，所以遙感成像很早就用了超能力的超感知。

遙感影像可以有各種不同光譜，可以檢測云、雪，區(qū)分地塊，可以對不同的區(qū)域進行不同的處理，把不同景別的數(shù)據(jù)進行連接和拼接。

所以，這是在可見光范疇之內的延伸，科技進步令我們在基礎的感知能力上有了核心的提升。

另外，人感知場景是 3D 立體的，而圖片永遠是 2D 的，在這方面，從 2D 到 2.5D 到 3D 的延伸給我們的應用帶來了非常不一樣的變化。

我們一直認為這樣對場景進行感知帶來的是新的交互能力，而交互能力的改變一直是互聯(lián)網(wǎng)革命的開始。

大家是否記得 iPhone 手機剛出滑動式交互的時候有一款非常火爆的游戲叫《憤怒的小鳥》？它火爆是因為它設計的理念非常吻合手機的人機交互的模式。

所以當我們的感知系統(tǒng)可以更好地感知 3D，可以把 3D 場景中的物體更好地呈現(xiàn)出來的時候，下一個新交互模式就有可能產(chǎn)生了，就是基于新的 3D 感知以及 AR/VR/MR 等技術的。

試想一下，如果未來利用單個攝像頭的手機，就能給大家?guī)聿灰粯拥?3D 體驗，那么2018 、2019 年一定會產(chǎn)生越來越多的基于與現(xiàn)實更完整融合的游戲場景、社交場景。所以，科學家做的是感知能力提升的概念。

三、科學家做大數(shù)據(jù)的先天不足

從理論基礎來說，我們發(fā)現(xiàn)科學家做大數(shù)據(jù)驅動人工智能的時候有很多先天性不足，目前來看，缺少可解的事情。

如果說以前是由人指導的智能，就是我們用大數(shù)據(jù)做統(tǒng)計學習，會在統(tǒng)計學習的過程中加很多先驗知識。

例如，我們認為在座的人的年齡分布是均勻分布的，或者是正態(tài)分布，這個分布情況是人為加的先驗。在某種意義上，先驗對于預測是有很大的指導作用的。

但是，當數(shù)據(jù)越來越大，人不對這個數(shù)據(jù)做先驗假設了，所有的規(guī)律都要智能從數(shù)據(jù)中自己學出來，這種情況會帶來一個問題，產(chǎn)生一個很大的缺陷：缺少可解釋性。

所以，在大數(shù)據(jù)角度，我們真正意義上要解決的問題之一是，我們可能需要對數(shù)據(jù)、機器認知的內容給出更多的標注，也就是一些正確答案，但并不是所有的事物都有正確答案，所以我們還缺少用于監(jiān)督的信息。

舉例：

A 正向學習

在一些特定的場景下，如我們遇到過一個醫(yī)療場景的需要，一個醫(yī)院研究所有兩個國家級的老專家，能夠通過片子看出早期疾病，老專家希望把知識傳授給電腦，他們問我們能不能做這樣的事。

機器目前能做的是做一些定義非常清晰的概念，這是不是早期的某種病患事情本身是定義非常清晰的，可惜的是樣本數(shù)太少。

要做這樣的訓練通常需要一百萬的數(shù)據(jù)。香港醫(yī)生一天閱片不能超過 8 張（超過 8 張稱之為疲勞閱片，是要上報的）。如果按照老專家一天讀 10 張的進度，要 300 年-500 年的診斷才能夠提供足夠的數(shù)據(jù)，這件事情在各種意義上難度非凡。

在這種缺乏樣本的學習方面，目前的科學家正在順著理論基礎往上查，把原來的問題轉化成新的研究問題，譬如說多模態(tài)、多任務的學習，弱監(jiān)督、無監(jiān)督的學習，甚至是做在沒有樣本的情況下遷移樣本、生成樣本的學習。

B 逆向打通

我可以通過增強學習來幫助我們打通。例如我們現(xiàn)在已經(jīng)可以用一句描述形成一張照片：小鳥有白色的胸部、淺灰色的頭部和黑色的翅膀和尾巴。機器生成了一張照片，也就是說世界上不存在這只鳥。

這就說明，我們已經(jīng)可以逆向打通這個環(huán)節(jié)：從文本描述生成樣本數(shù)據(jù)、樣本案例。

繼續(xù)推演，如果能夠用文本生成圖片，是不是也可以用文本生成視頻？導演可能就不用干活了，因為寫一個劇本就能生成視頻?？茖W就是把一些原本覺得不可能的事情漸漸變?yōu)榭赡堋?/span>

大家看到這樣的技術后，說不定可以不要輕信朋友圈轉發(fā)的內容了，因為萬事都有可能。

但是，這些科學技術的突破，從感知能力、理論基礎的提升角度來說，還與真正的產(chǎn)業(yè)有很長的距離。

四、產(chǎn)業(yè)界在做哪些事情？

產(chǎn)業(yè)的 AI 突破，首先就是“云+端”模式打通：云端就是服務器、計算能力的提升，而端就是從各種設備端，有越來越強的計算能力。

為了迎接 AI 技術的突破，其實有越來越多的設備已經(jīng)準備好了智能，或者被智能化，目前就看有沒有合適的算法放到我的車里、機器人里、手機里……甚至其他各種各樣的手持設備上，這個是產(chǎn)業(yè)正在發(fā)生的有趣的變化。

從我們現(xiàn)在來看，AI 技術應用趨勢是多場景、多維聯(lián)動，全棧式的創(chuàng)新能力，從底層的算法到中間各式各樣的技術模塊，再到上面提過的核心的應用。

這部分核心應用，在真正意義上，與產(chǎn)業(yè)的真實需求，仍然不一樣。

我們跟很多企業(yè)打過交道，企業(yè)說，“我們需要被 AI 化”。

企業(yè)還說，為了這個命題，我們找到了一堆問題，我們的人都做不好，是不是可以用 AI 的方法來調整？

我想說，不可能，很難做到。

五、產(chǎn)業(yè)界在做哪些事情？

剛才我講，當一個問題的定義、輸入、輸出都清晰，并且有人來打通這個流程的時候，用 AI 來替換這些能力，是會比較自然的。

所以 AI 做的事情只是在應用場景當中去提升生產(chǎn)效率。這個事情是能做的，但是如果在人都不知道這件事情該怎么做的情況下，要讓 AI 幫助你梳理、歸納、演繹，是非常艱難的。

所以我們需要能夠把真實的需求梳理清楚，帶到這個行業(yè)來。

要做到產(chǎn)業(yè)、科學的融合，我覺得有兩大塊外部要素：

要素一：外部的溫度環(huán)境。

要素二：工業(yè)化角度的“三化”。

首先，外部管理會起非常好的加速、催化作用。

從全球范圍看，中國是有史以來第一個從國家層面推動 AI 發(fā)展的國家，歐洲、美國大部分國家只是建議去做，但中國是全國推進的。

政策加溫、一些白皮書的制訂往往會從全民、全國的意義上幫助產(chǎn)業(yè)落地。

第二，資本增壓。我們看到，在現(xiàn)階段，資本對于人工智能、技術的擁抱使得這個產(chǎn)業(yè)從原始技術核心突破，到工業(yè)落地的整個鏈條都縮短了很多。

第三點，也是很關鍵的一點，就是資源齊備。

目前來看，計算能力已經(jīng)達到了一定程度；計算的資源，以及基于的平臺、對一些操作系統(tǒng)的研究等，都已經(jīng)達到了一個點。綜上所述，中國的外部環(huán)境已經(jīng)可以讓科學向產(chǎn)業(yè)進行很好的轉化。

從產(chǎn)業(yè)本身角度，要做到產(chǎn)業(yè)、科學的融合，還需要三個“化”：

第一，技術產(chǎn)品化。

沒有AI 企業(yè)會真正通過賣技術來變現(xiàn)，這非常難。一個核心技術的突破，就像無中生有一樣，所以對它進行商業(yè)變現(xiàn)的時候一定要有相應的產(chǎn)品來做載體，這個就是現(xiàn)在大部分企業(yè)正在逐步完成的技術產(chǎn)品化進程。

第二，落地規(guī)?；?。

如果我們要令一個技術形成足夠大的、真正意義上影響力，就需要它有規(guī)?；芰?。

在一個城市、兩個城市覆蓋沒有什么用，我們需要的是快速增長的能力，或者說，如果這些技術能夠被標準化地嵌入到某種產(chǎn)品中，那么它的推廣就會變得非常成功。

現(xiàn)在，大家使用的很多設備已經(jīng)搭載了非常多的 AI，比如，現(xiàn)在一些普通的手機攝像頭就能夠實現(xiàn)單反相機的虛實變化，其實就是 AI 技術落地到手機產(chǎn)品中的集中體現(xiàn)。

第三，場景多元化。

目前，AI 在哪個行業(yè)上最能形成行業(yè)的急劇變化，并不是很清晰，所以，場景多元化是可以把各個技術端融合，形成好的新技術的方式。

目前的情況有點像第一次工業(yè)革命的時候，技術突破了、有很好的蒸汽機，但是如果沒有多元化的場景應用，技術距離變現(xiàn)、推進產(chǎn)業(yè)革命還是有很長的距離。

當時的應用是：

可以做大規(guī)模的工業(yè)制造
可以做農(nóng)業(yè)的收割、灌溉
可以做鐵路、交通
當時世界上市值大的企業(yè)都是做鐵路做運輸?shù)摹?/span>

我們目前在公共服務、個人應用，到整個社會管理方面都會有變化。所以從這個角度來看，技術的場景多元化將是這波 AI 落地的核心要素之一。

首先，AI 和個人應用會給大家?guī)矸浅６嗟膴蕵坊^程。譬如說個人手機相冊管理，現(xiàn)在大家拍的照片，已經(jīng)可以根據(jù)人來進行管理，可以將自己的照片、我的朋友、我的小孩，我的家人分成不同的組。

未來，機器將可以根據(jù)年齡、親密程度等更多維度和標簽進行切分和梳理。

第二，AI 還可以具有更多的創(chuàng)造元素，例如可以在視頻中模擬各種各樣的藝術效果，甚至學習梵高、莫奈。

前段時間看到有人模仿齊白石畫的蝦，我覺得不用模仿了，你可以拍一張真的蝦，通過一個算法讓照片立刻變成齊白石的風格。

第三，AI 與社會治理還可以深度結合。

現(xiàn)在的極端，整個社會治理方面還沒有全盤使用技術，但如果我們從衣、食、住、行的各個方面，甚至從地面到天空的每個角度，都用算法來進行演練和演化的話，就可以做出一個整體化的規(guī)劃。

比如在出行領域，一方面，車內的 AI 可以幫助無人駕駛、避障、更好地提供導航的服務；另一方面；利用天上的 AI，實時感知地面的情況，可以對道路進行很好的規(guī)劃，使天和地的連接達到更好的協(xié)同作用。

所以，技術突破和場景完全可以有一個很大程度的連接。在不遠的未來，很多事情都可能有更好的變化。

六、終極的 AI 是什么？

不是產(chǎn)品，而是公共服務，因為 AI 能到千人千面。AI在未來會做到根據(jù)每個人的不同狀態(tài)給出真正意義上的定制化服務。

最后，我想說，AI 真的可以把每個人的生活變得更好，但科學和產(chǎn)業(yè)中間會有很長的路來連接， AI 的落地是一場耐力賽。目前來看，我們處在一個非常好的時代，因為環(huán)境正催化連接加速。謝謝大家！

下一篇：DFKI與IAV啟用聯(lián)合研發(fā)實驗室將AI用于汽車研發(fā)上一篇：康佳A1系列人工智能電視來襲，開啟智慧家居物聯(lián)

責任編輯：周帥潔

雙輪驅動徐立

国产精品奶水无码视频免费|激情五月天深爱网|精品国产女主播一区在线观看|国产黄网一区二区

商湯科技CEO徐立：讓AI產(chǎn)業(yè)化落地，還要靠這雙輪驅動？