国产精品奶水无码视频免费|激情五月天深爱网|精品国产女主播一区在线观看|国产黄网一区二区

百度輸入法 8.0 版本上線,王海峰稱其是“百度 AI 的橋頭堡”

2018-01-18 09:51:13 來源:雷鋒網(wǎng) 熱度:
All in AI 的百度,1月17日在北京發(fā)布了百度 AI 輸入法,即百度輸入法的 8.0 版本。意料之中,AI 依然是重頭戲,并且?guī)砹艘豁?xiàng)技術(shù)突破、兩項(xiàng)全新功能,以及超過競(jìng)品 20% 的相對(duì)正確率。
 
為了這次發(fā)布,百度特意將著名主持人、“中國(guó)好舌頭”華少請(qǐng)到了現(xiàn)場(chǎng)擔(dān)任主持,在華少的主持之下,百度副總裁、AIG 負(fù)責(zé)人王海峰、百度語音技術(shù)部總監(jiān)高亮以及百度輸入法負(fù)責(zé)人蔡玉婷悉數(shù)登場(chǎng)。
 

 
王海峰回顧了人機(jī)交互的歷史,從打孔紙帶到字符再到圖形界面,智能手機(jī)出現(xiàn)后,則出現(xiàn)了觸摸的交互方式。他認(rèn)為,對(duì)于智能手機(jī)來說,模擬鍵盤很重要,“一部手機(jī)可以沒有游戲、地圖、社交軟件,但是不能沒有鍵盤”。但接著他也表示,即便現(xiàn)在有語音輸入的加持,其實(shí)還不足夠,未來的輸入方式一定是“全感官輸入”,一定是由 AI 技術(shù)來支撐的。
 
而針對(duì)百度輸入法這個(gè)產(chǎn)品,王海峰表示,百度輸入法是百度 AI 技術(shù)應(yīng)用的橋頭堡,新的 AI 技術(shù)將會(huì)首先應(yīng)用在輸入法上,未來將會(huì)賦予更多 AI 能力,提升人機(jī)交互的體驗(yàn)。
 
一項(xiàng)技術(shù)突破:Deep Peak 2 模型
 
 
王海峰之后,百度語音技術(shù)部總監(jiān)高亮上臺(tái),揭示了“近半年來百度語音技術(shù)上的一項(xiàng)突破”,即 Deep Peak 2 模型:
 
Deep Peak 2 模型的全稱為基于 LSTM 和 CTC 的上下文無關(guān)音素組合建模,該技術(shù)將高頻出現(xiàn)的音素聯(lián)合在一起,形成一個(gè)音素組合體,然后將這個(gè)音素組合體看作一個(gè)基本建模單元。與以往使用的上下文相關(guān)建模方式相比,Deep Peak 2 模型能夠充分發(fā)揮神經(jīng)網(wǎng)絡(luò)模型的參數(shù)優(yōu)勢(shì),對(duì)多種說話方式的穩(wěn)定性更強(qiáng)、準(zhǔn)確度更高;同時(shí)能夠帶來更快的解碼速度,提升語音識(shí)別的整體效率,目前其相對(duì)正確率已領(lǐng)先行業(yè) 20%。
 
 
除此之外,高亮表示,這種建模方式對(duì)中文和英文都同時(shí)適用,讓產(chǎn)品具備了更強(qiáng)的中英文混合識(shí)別能力。相對(duì)正確率領(lǐng)先行業(yè) 20%,是基于一個(gè)有 1400 句的黑盒測(cè)試集測(cè)試的結(jié)果,而同比之前版本的百度輸入法,Deep Peak 2 模型在整體上確實(shí)提高了百度輸入法的準(zhǔn)確率。
 
兩項(xiàng)全新功能:語音速記和AR表情
 
在這項(xiàng)突破的支持下,新版本的百度輸入法推出了兩項(xiàng)全新功能,分別是語音速記和AR表情,在此之前,通過語音輸入,百度輸入法其實(shí)已經(jīng)具備了很多功能,諸如語音修改、語音中英日實(shí)時(shí)互譯、語音輕聲識(shí)別、場(chǎng)景化語音識(shí)別、語音聯(lián)想表情、OCR掃描輸入等。
 
所謂語音速記,分為單人、多人兩種模式。在單人模式下,適用于記筆記、寫文章、記錄靈感等場(chǎng)景,可以連續(xù)不間斷,并且同時(shí)記錄下音頻文件,方便后期進(jìn)行修改。而多人模式則適用于一對(duì)一采訪、2-4人小型會(huì)議的場(chǎng)景,并且應(yīng)用了聲紋識(shí)別,可以區(qū)分不同說話人。
 
在活動(dòng)現(xiàn)場(chǎng),主持人華少在58秒內(nèi)用極快語速念了一段426字、中英文混雜的“廣告”,輸入法均做了實(shí)時(shí)轉(zhuǎn)錄。
 
 
所謂AR表情,基于百度的人臉識(shí)別技術(shù)和 AR 技術(shù),用戶不僅可根據(jù)相機(jī)或相冊(cè)進(jìn)行人臉識(shí)別、制作表情包,還支持用戶通過自己的表情控制虛擬人物形象。制作出來的AR表情,可以直接通過輸入法搜索、語音輸入和鍵盤輸入時(shí)展示出來。蔡玉婷解釋說,百度輸入法不僅僅想要通過麥克風(fēng)進(jìn)行語音輸入,也希望控制更多的“感官”,實(shí)現(xiàn)多模態(tài)的輸入。
 
同時(shí),百度輸入法還與桃花塢等中國(guó)非物質(zhì)文化遺產(chǎn)達(dá)成合作,將中國(guó)民間傳統(tǒng)藝術(shù)如年畫等引入到表情中,讓眾多古典人物形象沖破次元壁壘“活”了起來,成為對(duì)中國(guó)歷史文化最好的傳承。
 
 
截至目前,百度輸入法這款產(chǎn)品上線已有8年,月活躍量達(dá)到 4 億,而語音輸入日流量達(dá)到 2.5億,8.0安卓版本已經(jīng)上線,iOS 版本正在經(jīng)由蘋果審核。面對(duì)未來的輸入法形態(tài),蔡玉婷認(rèn)為,百度 AI 輸入法未來想要做的,是聽見、看見、理解用戶的表達(dá),全面提升用戶輸入的效率。
 
而這也將成為,百度和其他廠商的輸入法之間,最大的不同。

責(zé)任編輯:黃焱林

相關(guān)推薦

門戶烽煙再起 百度等三公司獲互聯(lián)網(wǎng)新聞牌照

昨日,記者獲悉,天天在線、百度和和訊三家網(wǎng)站已經(jīng)獲得了由國(guó)務(wù)院新聞辦簽發(fā)的《互聯(lián)網(wǎng)新聞信息服務(wù)許可證》。天天在線內(nèi)部人士告訴記者,公司將嘗試增加文字等其他內(nèi)容形式,原先天天在線以視頻內(nèi)容為主。該人士稱,早在去年12月30日天天在線就已經(jīng)獲得網(wǎng)絡(luò)新聞牌照。國(guó)務(wù)院新聞辦此次一共頒發(fā)了3張新聞牌照,共有上百家企業(yè)爭(zhēng)奪。和訊網(wǎng)的公開信息顯示,國(guó)務(wù)院新聞辦于去年12月30日正式為和訊網(wǎng)簽發(fā)該證書,許可證編號(hào)為1112006009。和訊此前試圖向Web2.0方向轉(zhuǎn)型,但2005年11月掌舵人謝文的離職宣告該戰(zhàn)略受挫。和訊于今年1月8日任命了新的總編輯———新京報(bào)原總編輯楊斌,這被認(rèn)為是徹底放棄了Web2.

百度將做數(shù)據(jù)增值服務(wù) 與門戶差異化競(jìng)爭(zhēng)

百度將在數(shù)據(jù)增值領(lǐng)域進(jìn)行開拓。記者從百度內(nèi)部人士處獲悉,百度將在今年一季度之內(nèi),推出和數(shù)據(jù)有關(guān)的服務(wù)內(nèi)容。而類似新聞門戶的互聯(lián)網(wǎng)新聞模式可能不會(huì)在近期大規(guī)模開展。該人士稱,百度高層對(duì)這一項(xiàng)目較為重視,成立了專門項(xiàng)目組,并已進(jìn)入實(shí)施階段。事實(shí)上,對(duì)于如何利用歷年來積累的龐大網(wǎng)民搜索行為數(shù)據(jù)庫(kù),百度一直在進(jìn)行內(nèi)部評(píng)估。百度將在此領(lǐng)域選擇可能的模式有:第一,推出基于搜索數(shù)據(jù)挖掘的“數(shù)據(jù)新聞”以鞏固百度搜索的影響力。這種數(shù)據(jù)新聞將以每天、每周、每月的網(wǎng)民搜索數(shù)據(jù)為基礎(chǔ),提供搜索趨勢(shì)的關(guān)注報(bào)告和相關(guān)新聞。另一種是,百度將與國(guó)際咨詢業(yè)企業(yè)合作,直接進(jìn)軍數(shù)據(jù)服務(wù)業(yè)。充分利用百度的數(shù)據(jù)挖掘和分析能力,制作相關(guān)