拿下微軟人臉識(shí)別世界杯冠軍的中國(guó)公司什么背景
2017-07-31 16:35:51 來源:AI Lab 熱度:
2016年6月,微軟向公眾發(fā)布了大規(guī)模現(xiàn)實(shí)世界面部圖像數(shù)據(jù)集MS-Celeb-1M,含有10萬個(gè)名人的約1000萬(10M)張臉部圖片,鼓勵(lì)研究人員使用這些數(shù)據(jù)集開發(fā)、測(cè)試人臉識(shí)別技術(shù)。

同時(shí),微軟還宣布了MS-Celeb-1M百萬人臉識(shí)別挑戰(zhàn)賽。參賽者需要根據(jù)(但不限于)挑戰(zhàn)賽提供的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù),開發(fā)圖像識(shí)別系統(tǒng),從臉部圖像中識(shí)別100萬個(gè)名人。
簡(jiǎn)而言之,抽取一張名人照片,參賽團(tuán)隊(duì)利用自己設(shè)計(jì)的模型識(shí)別出這個(gè)人是誰(shuí),這個(gè)使用場(chǎng)景非常貼近日常生活,且更容易進(jìn)入商業(yè)環(huán)境,比如圖像字幕和新聞視頻分析、輿情分析等等。
即使是在微軟看來,MS-Celeb-1M這件事兒是非常有意義的——數(shù)據(jù)集有效填補(bǔ)了工業(yè)界跟學(xué)術(shù)界的空白,通過有針對(duì)的評(píng)估指標(biāo)設(shè)計(jì),競(jìng)賽實(shí)現(xiàn)了人臉“端到端”識(shí)別,有助于參賽模型投入現(xiàn)實(shí)應(yīng)用。
在今年的一場(chǎng)挑戰(zhàn)賽中,一家中國(guó)初創(chuàng)公司獲得了百萬名人識(shí)別子命題有限制類第一名,它的名字是獵戶星空。
有限類數(shù)據(jù)比賽,比拼的是技術(shù)算法、團(tuán)隊(duì)的產(chǎn)品邏輯思維
借助AI界計(jì)算機(jī)視覺領(lǐng)域頂級(jí)會(huì)議ICCV 2017的平臺(tái),微軟推出了——既包括大規(guī)模人臉識(shí)別競(jìng)賽(Hard Set及Random Set),也推出全新的、更具挑戰(zhàn)性的小樣本學(xué)習(xí)(Low-Shot Learning)競(jìng)賽,堪稱“級(jí)別最高、難度最大”的技術(shù)賽事。
在這場(chǎng)賽事中,無限制類不是單純算法的比拼,在某種程度上是在比拼數(shù)據(jù),數(shù)據(jù)越多訓(xùn)練的模型越好,無限制類是算法和數(shù)據(jù)的綜合比拼;而有限制類則是單純算法的比拼,也是從算法層面難度更大的比拼,據(jù)PingWest品玩(微信號(hào):wepingwest)了解這個(gè)——“東西只能靠算法,因?yàn)閿?shù)據(jù)是一定的。當(dāng)沒有外部數(shù)據(jù)的情況下達(dá)到最高精度是非常困難的。”因此,組委會(huì)也認(rèn)為了獵戶星空的難度極高,單獨(dú)列了一項(xiàng)采用受限數(shù)據(jù)集的子項(xiàng)目。
所以在獵戶星空所參與的這個(gè)項(xiàng)目里,不可以使用外部數(shù)據(jù),有限制類別只能在限定的數(shù)據(jù)集內(nèi)調(diào)用,比拼團(tuán)隊(duì)的算法能力。
簡(jiǎn)而言之,就是用盡量少的資源輸出最好的結(jié)果,其難點(diǎn)在于技術(shù)算法以及團(tuán)隊(duì)整體的產(chǎn)品設(shè)計(jì)思維。
獵戶星空介紹,有限定數(shù)據(jù)集的競(jìng)賽難度主要在于——競(jìng)賽數(shù)據(jù)噪聲很大,無法直接用于訓(xùn)練;而整個(gè)訓(xùn)練數(shù)據(jù)集非常大,適合人臉模型大規(guī)模訓(xùn)練的模型對(duì)資源的要求又很高,很難做到又快又好。
“訓(xùn)練數(shù)據(jù)太臟。這里的臟是指一個(gè)類別里有很多不同的人,有時(shí)我觀察一個(gè)類別都不知道正確的人應(yīng)該是誰(shuí),這種數(shù)據(jù)直接訓(xùn)練很難。”PingWest品玩向相關(guān)人士了解到。
經(jīng)過研究,獵戶星空設(shè)計(jì)了一種魯棒的去噪算法,可以針對(duì)各類不同程度的噪聲數(shù)據(jù)都進(jìn)行有效地去噪。同時(shí)選擇采用適合大規(guī)模訓(xùn)練的triplet模型,并創(chuàng)新地使用了一種巧妙的設(shè)計(jì),在有限資源下加速了triplet網(wǎng)絡(luò)的訓(xùn)練,也大大提升了性能。
最終獵戶星空?qǐng)F(tuán)隊(duì)獲得0.75/0.606(random set/hard set)的高分。用比賽舉辦方的話來說,0.75已經(jīng)接近滿分,是一個(gè)非常難以達(dá)到的成績(jī)。而在hard set上0.606的成績(jī),也是遠(yuǎn)遠(yuǎn)超過去年的最好成績(jī)(0.534)。
一個(gè)問題是——一年成立剛剛一年的公司,就能在這樣的賽事里拿下這樣的成績(jī),這家公司是什么背景?
獵戶星空的背后,是圖像、語(yǔ)音識(shí)別兩大核心技術(shù)
AI技術(shù)所面臨的問題,現(xiàn)在已經(jīng)明顯——學(xué)術(shù)界的人才不停發(fā)paper,卻不一定能在大公司中將技術(shù)應(yīng)用落地,快速推向市場(chǎng);而目前缺失的是工業(yè)界的人才——他們面臨著如何將論文、學(xué)術(shù)轉(zhuǎn)化為實(shí)際產(chǎn)品應(yīng)用的問題。如何打開AI技術(shù)的應(yīng)用市場(chǎng),其實(shí)更注重后者。
獵戶星空所扮演的角色就是后者,讓技術(shù)落地,更貼近消費(fèi)者。如今也已經(jīng)擁有了不少落地產(chǎn)品。
檢索這家公司的資料——獵戶星空全名為北京獵戶星空科技有限公司,創(chuàng)立于2016年9月,是獵豹移動(dòng)旗下人工智能公司。獵戶星空成立初就匯聚了全球人工智能的精英人才,初創(chuàng)團(tuán)隊(duì)擁有來自美國(guó)硅谷,日本,臺(tái)灣地區(qū),中國(guó)北京,深圳等全球一流科技公司技術(shù)大牛和產(chǎn)品極客。
最早,獵戶星空投身人臉識(shí)別的研究和探索,他們?cè)诮衲闘FW人臉識(shí)別的評(píng)測(cè)中取得了前三名的成績(jī),技術(shù)算法上——與只追求精度的團(tuán)隊(duì)不同的是獵戶星空是用盡量小的網(wǎng)絡(luò)來追求盡量高的精度的事情;而產(chǎn)品應(yīng)用上,他們的策略就是快速應(yīng)用到產(chǎn)品上。
據(jù)了解——關(guān)于這次人臉識(shí)別的比賽技術(shù),獵戶星空會(huì)運(yùn)用到實(shí)際場(chǎng)景中,最后將會(huì)落地在門禁、機(jī)器人、移動(dòng)app等具體的產(chǎn)品里。
其人臉識(shí)別技術(shù)已經(jīng)應(yīng)用到獵豹移動(dòng)旗下的直播產(chǎn)品Live.me中,在Live.me上主要的作用就是鑒黃,直播平臺(tái)每天會(huì)產(chǎn)生超過20萬小時(shí)的直播內(nèi)容,而運(yùn)用圖像識(shí)別技術(shù)進(jìn)行24小時(shí)的實(shí)時(shí)監(jiān)控,極大地提高工作效率和成果。
語(yǔ)音識(shí)別方面,今年6月,獵戶星空聯(lián)合喜馬拉雅發(fā)布了一款面向用戶的小雅AI音箱。這是獵戶星空AI生態(tài)鏈上的第一款產(chǎn)品,小雅AI音箱背后的核心便是獵戶星空全鏈路自研的遠(yuǎn)場(chǎng)語(yǔ)音交互技術(shù),這套系統(tǒng)從有呼必應(yīng)、優(yōu)質(zhì)點(diǎn)播體驗(yàn)和海量?jī)?nèi)容等多方面打造完美的用戶體驗(yàn)。
僅僅過了一個(gè)月,小米也發(fā)布了小米的第一款A(yù)I音箱——“小愛同學(xué)”。這也是獵豹移動(dòng)旗下人工智能公司獵戶星空與小米的首次合作,這款產(chǎn)品由獵戶星空提供人聲回應(yīng)技術(shù)以語(yǔ)音合成等技術(shù)。
簡(jiǎn)而言之,當(dāng)“小愛同學(xué)”再被喚醒的時(shí)候,回答的那一聲“誒”“我在”等交流內(nèi)容由獵戶星空提供;而語(yǔ)音合成技術(shù)則是處理語(yǔ)音回饋時(shí)候的語(yǔ)音模型、語(yǔ)調(diào),讓她聽起來不那么機(jī)器人呢,更像是一個(gè)自然人。通過TTS語(yǔ)音合成模式,還可以讓你喜歡的明星用它的語(yǔ)氣和聲調(diào)每天叫你起床。
讓技術(shù)快速和旗下應(yīng)用產(chǎn)品結(jié)合,正是這一家產(chǎn)品思維型AI公司的核心訴求。
傅盛的AI思維和獵豹的轉(zhuǎn)變
在獵豹CEO傅盛看來,互聯(lián)網(wǎng)+是上一波認(rèn)知紅利,下一個(gè)則是AI ,AI+時(shí)代已經(jīng)到來。
互聯(lián)網(wǎng)產(chǎn)業(yè)改變了我們傳統(tǒng)意義上認(rèn)知的那個(gè)新聞+互聯(lián)網(wǎng),變成了一個(gè)更龐大的互聯(lián)網(wǎng)世界。而AI人工智能技術(shù)也會(huì)是對(duì)整個(gè)產(chǎn)業(yè)的重構(gòu),是對(duì)我們整個(gè)思維方法的重新塑造。
“AI就跟互聯(lián)網(wǎng)一樣,互聯(lián)網(wǎng)本質(zhì)上是一個(gè)技術(shù)突破嗎?它是由于產(chǎn)生這個(gè)協(xié)議、產(chǎn)生這個(gè)網(wǎng)站以后,使得很多的產(chǎn)品形式發(fā)生了改變。今天你看到的所有比如是支付,我們也叫互聯(lián)網(wǎng)+,所有的行業(yè)都架在互聯(lián)網(wǎng)上。今天互聯(lián)網(wǎng)所有的紅利都來自于和傳統(tǒng)行業(yè)的結(jié)合、和應(yīng)用的結(jié)合。我們真正想一想互聯(lián)網(wǎng)的第一波其實(shí)也是一個(gè)互聯(lián)網(wǎng)+,它是把新聞和互聯(lián)網(wǎng)結(jié)合,然后是內(nèi)容和互聯(lián)網(wǎng)結(jié)合、娛樂和互聯(lián)網(wǎng)結(jié)合,它都是一種基本的技術(shù)手段。
所以AI我認(rèn)為也是這樣一個(gè)東西,它其實(shí)是可以改變很多行業(yè)的行業(yè)規(guī)則的,它本身很難成為一個(gè)所謂獨(dú)立的行業(yè),一定要和應(yīng)用的結(jié)合。所以叫AI+時(shí)代的到來。”
人工智能將現(xiàn)實(shí)所有物理事件產(chǎn)生的東西歸結(jié)于一個(gè)點(diǎn)——數(shù)據(jù)。然后,再把這個(gè)數(shù)據(jù),用神經(jīng)網(wǎng)絡(luò)的方式去認(rèn)知和理解,達(dá)到過去所有算法無法企及的高度。
傅盛認(rèn)為,深度學(xué)習(xí)的機(jī)會(huì)在于和應(yīng)用的結(jié)合而不是技術(shù)輸出。深度學(xué)習(xí)的核心是數(shù)據(jù)驅(qū)動(dòng),雖然有模型調(diào)參,有自己的優(yōu)勢(shì),但別人有更多的數(shù)據(jù)調(diào)參很快拉平優(yōu)勢(shì),很難真的想像一家公司通過提供技術(shù)輸出就能成功。
在傅盛這樣的思維下,獵豹已經(jīng)展開了內(nèi)容產(chǎn)品的布局。
獵豹移動(dòng)最早期的定位是安全、工具類產(chǎn)品。在成功實(shí)現(xiàn)了工具產(chǎn)品的商業(yè)化之后,獵豹移動(dòng)開始升級(jí)賽道。
除了在美國(guó)市場(chǎng)做直播產(chǎn)品Live.me,收購(gòu)新聞服務(wù)運(yùn)營(yíng)商N(yùn)ews Republic,獵豹還投資了Musical.ly短視頻團(tuán)隊(duì)。
根據(jù)2017年第一季度的財(cái)報(bào)顯示,內(nèi)容型應(yīng)用對(duì)獵豹總收入的貢獻(xiàn)從上一季度的11.3%增長(zhǎng)到了18.8%,環(huán)比增長(zhǎng)55.2%。這都得益于旗下內(nèi)容型產(chǎn)品——Live.me、News Republic等在海外市場(chǎng)的搶眼表現(xiàn),兩款產(chǎn)品都使用到了人工智能的技術(shù)。
這家獵戶星空公司,應(yīng)該就是驅(qū)動(dòng)獵豹步伐加快的新動(dòng)力吧。
責(zé)任編輯:黃焱林