国产精品奶水无码视频免费|激情五月天深爱网|精品国产女主播一区在线观看|国产黄网一区二区

商湯科技CEO徐立:讓AI產(chǎn)業(yè)化落地,還要靠這雙輪驅動?

2018-01-30 10:35:20 來源:搜狐科技 熱度:

目前,人工智能浪潮的興起與很多科學家創(chuàng)業(yè)有很大關系,從某種意義上,這是一種科學產(chǎn)業(yè)。但這只是最近幾年才發(fā)生的。

在我讀書的時候,有一個段子:我們要去讀博士,很多海外名校教授說,其實讀博士不是一個致富的路徑,一般是有錢了再去讀博士、做科學家,與做科學家是為了有錢,這兩個邏輯是反的。

還有一個事實是,在中世紀,基本上只有貴族才能做真正的科學研究,因為科學和產(chǎn)業(yè)之間的矛盾和沖突非常大,它們是兩個截然不同的點。

 

我們定義了科學家:認真做科學研究,專注于技術、基礎理論的突破。

從100 年前到現(xiàn)在,很多時候,很多理論得到了創(chuàng)新和發(fā)展,但是真正意義上能夠和產(chǎn)業(yè)結合的很少,我們大家耳熟能詳各種各樣的科學家,但科學真正意義上的成功,都與最后的產(chǎn)業(yè)落地相距較遠,產(chǎn)業(yè)關注什么事情?

關注真正的盈利能力、標準化、快速變現(xiàn)、解決方案……真正的產(chǎn)業(yè),實際上來自于市場的需求。

所以,科學和產(chǎn)業(yè)還是背道而馳的,完全不一樣的概念。但現(xiàn)在這個階段,這兩條線似乎走到了交叉路口。那么,到底什么事情使得科學和產(chǎn)業(yè)能夠交匯在一起?

我覺得很關鍵的一點是,科學和產(chǎn)業(yè)的交匯點是雙輪驅動的。

一、雙輪驅動科學與產(chǎn)業(yè)交匯

什么是雙輪驅動?

第一,技術突破是增量性的。

通常情況下,技術核心突破來得快一點,而科學發(fā)展會有幾年是平穩(wěn)的,也就是說,理論研究非常重要,但是未必能夠真正被應用到我們認為的、認知的商業(yè)上去。

而科技有時是跳躍式發(fā)展的,它不是直線性、增量性的。

比如說,人工智能的這一輪突破,從某種意義上,就是把傳統(tǒng)的人工指導的智能,轉化成純數(shù)據(jù)驅動的智能,包括我們現(xiàn)在耳熟能詳?shù)纳疃葘W習、基于深度學習的純數(shù)據(jù)驅動方法在內,都是顛覆式的變化,而不是一個增量式的變化。

也只有在這種狀態(tài)下,才能夠帶來完全不同的新生產(chǎn)力。

第二,產(chǎn)業(yè)需要具備怎樣的條件?

剛才我舉例說,目前的人工智能是顛覆式的科技發(fā)展,其實這樣顛覆性的發(fā)展在歷史上也發(fā)生過,比如一些新材料、新能源的發(fā)現(xiàn),但是它們在真正意義上未必等價于能進行產(chǎn)業(yè)變現(xiàn)與變化。

例如鎢絲,發(fā)現(xiàn)很久了,但真正被用到燈泡里作為一個燈,需要從現(xiàn)實的場景倒推到材料的突破和材料的革命,這是一個非常重要的點。(筆記書堂推薦《我們如何走到今天·重塑世界的6項創(chuàng)新》,書中集中講述了科技發(fā)明史中成功變化為產(chǎn)業(yè)的6項發(fā)明。文末有售。)

那么,從產(chǎn)業(yè)界角度,到底什么是重要的呢?

二、科技的產(chǎn)業(yè)現(xiàn)狀與發(fā)展

從產(chǎn)業(yè)的角度,在于產(chǎn)業(yè)的需求是否在真正意義上到達了爆發(fā)的臨界點,也就是大眾是否已經(jīng)被足夠好的教育過了,這個科學技術是否已經(jīng)可以普羅大眾。

因為,科技進步能夠帶來的是顛覆式的勞動力、生產(chǎn)力;同時,如果市場被教育了,能夠帶來的是被大家認知的需求。

有了這兩樣要素,我們就覺得科學技術的推進與產(chǎn)業(yè)的變化能夠合在一起了,可以引領人類進步、改變人類生活。

商湯科技關注的是計算機視覺、人工智能眼睛的部分。我們希望能夠幫人看清、看懂這個世界,從這個角度來講,科學家到底在做什么?

未來,科學家的延展方向很大程度上在于感知層面。

我們能否知道、看清核心與本質,在于是否有更好的感知能力,而感知的能力不僅可以從硬件的角度突破,算法、理論,以及背后的支撐都可以帶來突破感知能力核心的機會。

從之前到現(xiàn)在,大部分的感受器處理的都是可見光,這一兩年,感受器在視覺領域已經(jīng)從可見光轉到了不可見光,我們可以有 UV 攝像頭,可以有遠紅外、近紅外攝像頭,甚至還有各種熱敏攝像頭,打開了一個完全不一樣的應用范疇。

舉個例子:

iPhone X 支持人臉解鎖或支付,就是感知能力從可見光轉到近紅外的體現(xiàn)。

在近紅外的情況下,我們可以做到更好地識別真人、更好地驗證,所以給真正的支付,也就是打通線上線下場景起到了保駕護航作用。

我們還可以看到,現(xiàn)在路面上的攝像頭也很多,很多人認為到了晚上攝像頭就看不到了,實際上攝像頭的感知能力已經(jīng)達到了星光級,甚至是極光級了,也就是在非常黑的情況下都可以有非常完美的成像。

地上的攝像頭如此,天上的攝像頭也是如此(此處指遙感相關設備)。

商湯科技一直認為,目前來看,行業(yè)發(fā)展空間最大的是地面攝像頭的應用,但是未來,天上的攝像頭越來越多的情況下,大家都會面臨同樣的處理數(shù)據(jù)問題,所以遙感成像很早就用了超能力的超感知。

遙感影像可以有各種不同光譜,可以檢測云、雪,區(qū)分地塊,可以對不同的區(qū)域進行不同的處理,把不同景別的數(shù)據(jù)進行連接和拼接。

所以,這是在可見光范疇之內的延伸,科技進步令我們在基礎的感知能力上有了核心的提升。

另外,人感知場景是 3D 立體的,而圖片永遠是 2D 的,在這方面,從 2D 到 2.5D 到 3D 的延伸給我們的應用帶來了非常不一樣的變化。

我們一直認為這樣對場景進行感知帶來的是新的交互能力,而交互能力的改變一直是互聯(lián)網(wǎng)革命的開始。

大家是否記得 iPhone 手機剛出滑動式交互的時候有一款非常火爆的游戲叫《憤怒的小鳥》?它火爆是因為它設計的理念非常吻合手機的人機交互的模式。

所以當我們的感知系統(tǒng)可以更好地感知 3D,可以把 3D 場景中的物體更好地呈現(xiàn)出來的時候,下一個新交互模式就有可能產(chǎn)生了,就是基于新的 3D 感知以及 AR/VR/MR 等技術的。

試想一下,如果未來利用單個攝像頭的手機,就能給大家?guī)聿灰粯拥?3D 體驗,那么2018 、2019 年一定會產(chǎn)生越來越多的基于與現(xiàn)實更完整融合的游戲場景、社交場景。所以,科學家做的是感知能力提升的概念。

三、科學家做大數(shù)據(jù)的先天不足

從理論基礎來說,我們發(fā)現(xiàn)科學家做大數(shù)據(jù)驅動人工智能的時候有很多先天性不足,目前來看,缺少可解的事情。

如果說以前是由人指導的智能,就是我們用大數(shù)據(jù)做統(tǒng)計學習,會在統(tǒng)計學習的過程中加很多先驗知識。

例如,我們認為在座的人的年齡分布是均勻分布的,或者是正態(tài)分布,這個分布情況是人為加的先驗。在某種意義上,先驗對于預測是有很大的指導作用的。

但是,當數(shù)據(jù)越來越大,人不對這個數(shù)據(jù)做先驗假設了,所有的規(guī)律都要智能從數(shù)據(jù)中自己學出來,這種情況會帶來一個問題,產(chǎn)生一個很大的缺陷:缺少可解釋性。

所以,在大數(shù)據(jù)角度,我們真正意義上要解決的問題之一是,我們可能需要對數(shù)據(jù)、機器認知的內容給出更多的標注,也就是一些正確答案,但并不是所有的事物都有正確答案,所以我們還缺少用于監(jiān)督的信息。

舉例:

A 正向學習

在一些特定的場景下,如我們遇到過一個醫(yī)療場景的需要,一個醫(yī)院研究所有兩個國家級的老專家,能夠通過片子看出早期疾病,老專家希望把知識傳授給電腦,他們問我們能不能做這樣的事。

機器目前能做的是做一些定義非常清晰的概念,這是不是早期的某種病患事情本身是定義非常清晰的,可惜的是樣本數(shù)太少。

要做這樣的訓練通常需要一百萬的數(shù)據(jù)。香港醫(yī)生一天閱片不能超過 8 張(超過 8 張稱之為疲勞閱片,是要上報的)。如果按照老專家一天讀 10 張的進度,要 300 年-500 年的診斷才能夠提供足夠的數(shù)據(jù),這件事情在各種意義上難度非凡。

在這種缺乏樣本的學習方面,目前的科學家正在順著理論基礎往上查,把原來的問題轉化成新的研究問題,譬如說多模態(tài)、多任務的學習,弱監(jiān)督、無監(jiān)督的學習,甚至是做在沒有樣本的情況下遷移樣本、生成樣本的學習。

B 逆向打通

我可以通過增強學習來幫助我們打通。例如我們現(xiàn)在已經(jīng)可以用一句描述形成一張照片:小鳥有白色的胸部、淺灰色的頭部和黑色的翅膀和尾巴。機器生成了一張照片,也就是說世界上不存在這只鳥。

這就說明,我們已經(jīng)可以逆向打通這個環(huán)節(jié):從文本描述生成樣本數(shù)據(jù)、樣本案例。

繼續(xù)推演,如果能夠用文本生成圖片,是不是也可以用文本生成視頻?導演可能就不用干活了,因為寫一個劇本就能生成視頻??茖W就是把一些原本覺得不可能的事情漸漸變?yōu)榭赡堋?/span>

大家看到這樣的技術后,說不定可以不要輕信朋友圈轉發(fā)的內容了,因為萬事都有可能。

但是,這些科學技術的突破,從感知能力、理論基礎的提升角度來說,還與真正的產(chǎn)業(yè)有很長的距離。

四、產(chǎn)業(yè)界在做哪些事情?

產(chǎn)業(yè)的 AI 突破,首先就是“云+端”模式打通:云端就是服務器、計算能力的提升,而端就是從各種設備端,有越來越強的計算能力。

為了迎接 AI 技術的突破,其實有越來越多的設備已經(jīng)準備好了智能,或者被智能化,目前就看有沒有合適的算法放到我的車里、機器人里、手機里……甚至其他各種各樣的手持設備上,這個是產(chǎn)業(yè)正在發(fā)生的有趣的變化。

從我們現(xiàn)在來看,AI 技術應用趨勢是多場景、多維聯(lián)動,全棧式的創(chuàng)新能力,從底層的算法到中間各式各樣的技術模塊,再到上面提過的核心的應用。

這部分核心應用,在真正意義上,與產(chǎn)業(yè)的真實需求,仍然不一樣。

我們跟很多企業(yè)打過交道,企業(yè)說,“我們需要被 AI 化”。

企業(yè)還說,為了這個命題,我們找到了一堆問題,我們的人都做不好,是不是可以用 AI 的方法來調整?

我想說,不可能,很難做到。

五、產(chǎn)業(yè)界在做哪些事情?

剛才我講,當一個問題的定義、輸入、輸出都清晰,并且有人來打通這個流程的時候,用 AI 來替換這些能力,是會比較自然的。

所以 AI 做的事情只是在應用場景當中去提升生產(chǎn)效率。這個事情是能做的,但是如果在人都不知道這件事情該怎么做的情況下,要讓 AI 幫助你梳理、歸納、演繹,是非常艱難的。

所以我們需要能夠把真實的需求梳理清楚,帶到這個行業(yè)來。

要做到產(chǎn)業(yè)、科學的融合,我覺得有兩大塊外部要素:

要素一:外部的溫度環(huán)境。

要素二:工業(yè)化角度的“三化”。

首先,外部管理會起非常好的加速、催化作用。

從全球范圍看,中國是有史以來第一個從國家層面推動 AI 發(fā)展的國家,歐洲、美國大部分國家只是建議去做,但中國是全國推進的。

政策加溫、一些白皮書的制訂往往會從全民、全國的意義上幫助產(chǎn)業(yè)落地。

第二,資本增壓。我們看到,在現(xiàn)階段,資本對于人工智能、技術的擁抱使得這個產(chǎn)業(yè)從原始技術核心突破,到工業(yè)落地的整個鏈條都縮短了很多。

第三點,也是很關鍵的一點,就是資源齊備。

目前來看,計算能力已經(jīng)達到了一定程度;計算的資源,以及基于的平臺、對一些操作系統(tǒng)的研究等,都已經(jīng)達到了一個點。綜上所述,中國的外部環(huán)境已經(jīng)可以讓科學向產(chǎn)業(yè)進行很好的轉化。

從產(chǎn)業(yè)本身角度,要做到產(chǎn)業(yè)、科學的融合,還需要三個“化”:

第一,技術產(chǎn)品化。

沒有AI 企業(yè)會真正通過賣技術來變現(xiàn),這非常難。一個核心技術的突破,就像無中生有一樣,所以對它進行商業(yè)變現(xiàn)的時候一定要有相應的產(chǎn)品來做載體,這個就是現(xiàn)在大部分企業(yè)正在逐步完成的技術產(chǎn)品化進程。

第二,落地規(guī)?;?。

如果我們要令一個技術形成足夠大的、真正意義上影響力,就需要它有規(guī)?;芰?。

在一個城市、兩個城市覆蓋沒有什么用,我們需要的是快速增長的能力,或者說,如果這些技術能夠被標準化地嵌入到某種產(chǎn)品中,那么它的推廣就會變得非常成功。

現(xiàn)在,大家使用的很多設備已經(jīng)搭載了非常多的 AI,比如,現(xiàn)在一些普通的手機攝像頭就能夠實現(xiàn)單反相機的虛實變化,其實就是 AI 技術落地到手機產(chǎn)品中的集中體現(xiàn)。

第三,場景多元化。

目前,AI 在哪個行業(yè)上最能形成行業(yè)的急劇變化,并不是很清晰,所以,場景多元化是可以把各個技術端融合,形成好的新技術的方式。

目前的情況有點像第一次工業(yè)革命的時候,技術突破了、有很好的蒸汽機,但是如果沒有多元化的場景應用,技術距離變現(xiàn)、推進產(chǎn)業(yè)革命還是有很長的距離。

當時的應用是:

可以做大規(guī)模的工業(yè)制造
可以做農(nóng)業(yè)的收割、灌溉
可以做鐵路、交通
當時世界上市值大的企業(yè)都是做鐵路做運輸?shù)摹?/span>

我們目前在公共服務、個人應用,到整個社會管理方面都會有變化。所以從這個角度來看,技術的場景多元化將是這波 AI 落地的核心要素之一。

首先,AI 和個人應用會給大家?guī)矸浅6嗟膴蕵坊^程。譬如說個人手機相冊管理,現(xiàn)在大家拍的照片,已經(jīng)可以根據(jù)人來進行管理,可以將自己的照片、我的朋友、我的小孩,我的家人分成不同的組。

未來,機器將可以根據(jù)年齡、親密程度等更多維度和標簽進行切分和梳理。

第二,AI 還可以具有更多的創(chuàng)造元素,例如可以在視頻中模擬各種各樣的藝術效果,甚至學習梵高、莫奈。

前段時間看到有人模仿齊白石畫的蝦,我覺得不用模仿了,你可以拍一張真的蝦,通過一個算法讓照片立刻變成齊白石的風格。

第三,AI 與社會治理還可以深度結合。

現(xiàn)在的極端,整個社會治理方面還沒有全盤使用技術,但如果我們從衣、食、住、行的各個方面,甚至從地面到天空的每個角度,都用算法來進行演練和演化的話,就可以做出一個整體化的規(guī)劃。

比如在出行領域,一方面,車內的 AI 可以幫助無人駕駛、避障、更好地提供導航的服務;另一方面;利用天上的 AI,實時感知地面的情況,可以對道路進行很好的規(guī)劃,使天和地的連接達到更好的協(xié)同作用。

所以,技術突破和場景完全可以有一個很大程度的連接。在不遠的未來,很多事情都可能有更好的變化。

六、終極的 AI 是什么?

不是產(chǎn)品,而是公共服務,因為 AI 能到千人千面。AI在未來會做到根據(jù)每個人的不同狀態(tài)給出真正意義上的定制化服務。

最后,我想說,AI 真的可以把每個人的生活變得更好,但科學和產(chǎn)業(yè)中間會有很長的路來連接, AI 的落地是一場耐力賽。目前來看,我們處在一個非常好的時代,因為環(huán)境正催化連接加速。謝謝大家!

責任編輯:周帥潔