国产精品奶水无码视频免费|激情五月天深爱网|精品国产女主播一区在线观看|国产黄网一区二区

當(dāng)語音識(shí)別撞上方言,誰比誰懵逼?

這幾年,各種各樣的技術(shù)和產(chǎn)品,就像地里的稻谷一樣,火了一茬又一茬。這不,近段時(shí)間,智能音箱又開始強(qiáng)勢(shì)崛起,巨頭們紛紛瞄向智能音箱市場(chǎng),引起了新一輪的血雨腥風(fēng)。
   
這一切源于近兩年智能家居開始流行的“解放雙手”,在這“解放雙手”的過程中語音識(shí)別是最關(guān)鍵的一環(huán),有很多人斷言沒有語音識(shí)別的的智能家居系統(tǒng)都是假智能家居。人們對(duì)于語音識(shí)別未來的發(fā)展充滿了信心,甚至在“語音識(shí)別”的百度百科中有這么一句話:人們預(yù)計(jì),未來10年內(nèi),語音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。當(dāng)然,小編同樣是語音識(shí)別的腦殘粉,對(duì)語音識(shí)別未來的發(fā)展前景充滿了美好的想象。不過,在充滿信心的同時(shí),小編我不禁對(duì)一個(gè)問題充滿了好奇:那些語音識(shí)別的巨頭企業(yè)一直在告訴大眾:我們的識(shí)別率已經(jīng)達(dá)到了95%了97%了,99%了,99.9%了!看他們打了雞血似的不斷更新這個(gè)數(shù)字,真是一件可喜可賀、喜大普奔的事情。但是,小編卻想歪個(gè)樓,識(shí)別率99%的語音識(shí)別搞得定方言嗎?
   
討論語音識(shí)別方言識(shí)別率的必要性
   
小編絕對(duì)不承認(rèn),這個(gè)問題的討論僅僅是基于小編本人無處釋放的無聊。所以我們就先來確定一下討論這個(gè)問題的必要性。對(duì)于國(guó)外的情況小編不是很了解,那咱們就來探討一下中國(guó)的方言情況。小編還記得大學(xué)時(shí)期《方言學(xué)》上課的第一天,我們那個(gè)漂亮的女教授說的第一句話就是:我想大家一定都聽過“十里不同音,百里不同俗”吧。十里不同音,這就是中國(guó)的語言現(xiàn)狀。在中國(guó),很多的人們說著彼此幾乎無法交流的語言,作為南方人小編深有感觸,也許真的走出自己家的小鎮(zhèn),就聽不懂當(dāng)?shù)厝苏f的是什么了。普通話的普及也不過短短幾十年,各種方言混雜的情況實(shí)在是太常見了。
   
那中國(guó)究竟有多少種方言呢?中國(guó)共有56個(gè)民族,除了回族沒有自己的語言之外,其他所有民族都有自己的語言,這就有50多種,但這并不是全部,因?yàn)樵诟鱾€(gè)方言區(qū)中又分布著多種土語。據(jù)不完全統(tǒng)計(jì),中國(guó)至少有80種以上的語言。除此之外,由于受到方言的影響,很多人的普通話會(huì)有一定的口音存在。其實(shí)對(duì)于這一點(diǎn),小編真的很有話語權(quán)啊,因?yàn)樾【幤綍r(shí)對(duì)一些企業(yè)管理者進(jìn)行采訪之后,用語音識(shí)別軟件將錄音轉(zhuǎn)錄出來時(shí),小編就發(fā)現(xiàn)口音對(duì)于語音識(shí)別的干擾真的是非常非常大的啊。但是然并卵,小編的軟件賬號(hào)丟失了,所以這些記錄都找不回來了,無圖無真相啊。
   
語音識(shí)別的原理
   
好了,先忽略口音的問題,讓我們回到方言識(shí)別這個(gè)問題。我們先來看看語音識(shí)別的技術(shù)原理,所謂語音識(shí)別,就是將一段語音信號(hào)轉(zhuǎn)換成相對(duì)應(yīng)的文本信息(我們這里不討論作為安防手段的聲紋識(shí)別,而是討論以人機(jī)交互為目的的語音識(shí)別),系統(tǒng)主要包含特征提取、聲學(xué)模型,語言模型以及字典與解碼四大部分,其中為了更有效地提取特征往往還需要對(duì)所采集到的聲音信號(hào)進(jìn)行濾波、分幀等預(yù)處理工作,把要分析的信號(hào)從原始信號(hào)中提取出來;之后,特征提取工作將聲音信號(hào)從時(shí)域轉(zhuǎn)換到頻域,為聲學(xué)模型提供合適的特征向量;聲學(xué)模型中再根據(jù)聲學(xué)特性計(jì)算每一個(gè)特征向量在聲學(xué)特征上的得分;而語言模型則根據(jù)語言學(xué)相關(guān)的理論,計(jì)算該聲音信號(hào)對(duì)應(yīng)可能詞組序列的概率;最后根據(jù)已有的字典,對(duì)詞組序列進(jìn)行解碼,得到最后可能的文本表示。
   
作為語音識(shí)別的前提與基礎(chǔ),語音信號(hào)的預(yù)處理過程至關(guān)重要。在最終進(jìn)行模板匹配的時(shí)候,是將輸入語音信號(hào)的特征參數(shù)同模板庫(kù)中的特征參數(shù)進(jìn)行對(duì)比,因此,只有在預(yù)處理階段得到能夠表征語音信號(hào)本質(zhì)特征的特征參數(shù),才能夠?qū)⑦@些特征參數(shù)進(jìn)行匹配進(jìn)行識(shí)別率高的語音識(shí)別。若果讓小編用一句話來進(jìn)行總結(jié)就是:對(duì)語音識(shí)別來說,給它足夠的數(shù)據(jù)量進(jìn)行學(xué)習(xí)是關(guān)鍵。
 
語音識(shí)別的方言識(shí)別率究竟如何?
   
那語音識(shí)別對(duì)于方言的識(shí)別情況究竟怎么樣呢?在寫稿的時(shí)候,小編就近找了兩個(gè)同事(一個(gè)是湖北赤壁人,一個(gè)是湖南長(zhǎng)沙人以及小編本人是湖南邵陽人)跟我一起進(jìn)行了一個(gè)簡(jiǎn)單的測(cè)試。
   
小編截取了這篇文章中的一段文字:那中國(guó)究竟有多少種方言呢?中國(guó)共有56個(gè)民族,除了回族沒有自己的語言之外,其他所有民族都有自己的語言,這就有50多種,但這并不是全部,因?yàn)樵诟鱾€(gè)方言區(qū)中有分布著多種土語。因此,據(jù)不完全統(tǒng)計(jì),中國(guó)至少有80種以上的語言。
   
小編讓同事分別用自己家鄉(xiāng)的方言念了一遍這段話,然后用微信的語音轉(zhuǎn)文字進(jìn)行轉(zhuǎn)寫,測(cè)試結(jié)果如下:

 
當(dāng)語音識(shí)別撞上方言,誰比誰懵逼?-DVBCN
湖南長(zhǎng)沙同事的測(cè)試結(jié)果

當(dāng)語音識(shí)別撞上方言,誰比誰懵逼?-DVBCN

湖北赤壁同事的測(cè)試結(jié)果

 
然后,小編其中一個(gè)多才多藝的同事表示,這樣的測(cè)試結(jié)果太慘絕人寰了,而且她覺得這樣催人淚下的結(jié)果,主要是因?yàn)槲覀冋f的話都太土了,于是她又用標(biāo)準(zhǔn)的武漢話念了一遍……
當(dāng)語音識(shí)別撞上方言,誰比誰懵逼?
   
我還能說什么呢?微信用的可是現(xiàn)在最火的訊飛輸入法。最后,小編又用普通話念了一遍這句話,算是為語音識(shí)別強(qiáng)力挽了一把尊,99%的識(shí)別率其實(shí)并不算是吹的。
 
   
當(dāng)然,小編的這個(gè)討論是國(guó)際化的,不可能僅僅局限于中國(guó)方言,接下來我們來看看國(guó)外的情況。不久前,一位來自美國(guó)的消費(fèi)者最近投訴亞馬遜Alexa:它并不能識(shí)別自己老媽的口音。“這些軟件似乎聽不懂我在說什么。”這位母親如是說。面對(duì)母親的抱怨,這位美國(guó)消費(fèi)者決定向亞馬遜反應(yīng)這一問題。這件事情肯定會(huì)讓人想起Siri,盡管蘋果在每次發(fā)布會(huì)上都似有似無的提到一句“我們又提升了Siri的識(shí)別率”,但實(shí)際效果正如大家所看到的這樣,有的時(shí)候它真的無能為力。不僅如此,小編記得在看《非正式會(huì)談》的時(shí)候,其中一個(gè)日本嘉賓就嘲笑過另一個(gè)日本嘉賓的大阪口音,而一個(gè)美國(guó)嘉賓也嘲笑過一個(gè)美國(guó)嘉賓的俄亥俄州口音,所以說這個(gè)方言和口音的問題真的是一個(gè)全球性的問題,語音識(shí)別任重而道遠(yuǎn)啊。
   
慧聰安防網(wǎng)總結(jié)
   
雖然小編在前文中說,這篇文章源于小編的無聊,但是小編必須嚴(yán)肅地說:我所討論的這個(gè)問題是具有非常大的現(xiàn)實(shí)意義的。以中國(guó)為例,因?yàn)槠胀ㄔ挼耐茝V時(shí)間太短,導(dǎo)致很多上了年紀(jì)的人基本不會(huì)講普通話,而且,這樣的人群并不在少數(shù)。當(dāng)然,現(xiàn)在很多語音識(shí)別系統(tǒng)都會(huì)考慮到方言的搭載,但是不得不說這是一個(gè)很漫長(zhǎng)的過程。
   
但是這還不是語音識(shí)別應(yīng)用推廣最大的問題,事實(shí)上,在小編看來,口音問題可能會(huì)是語音識(shí)別應(yīng)用更大的問題。和在這個(gè)測(cè)試中,小編與同事使用純方言這樣極端的情況不同的是,口音問題在我國(guó)是一個(gè)非常普遍存在的問題,尤其是在我國(guó)南方,很多人都帶有口音,而小編的經(jīng)驗(yàn)告訴我,對(duì)于這些有一定口音的普通話識(shí)別,語音識(shí)別技術(shù)很難做到99%,能達(dá)到70%的識(shí)別率就很不錯(cuò)了?;蛟S這會(huì)是小編的下一篇原創(chuàng)的主題,不過前提是我得先把訊飛聽見的賬號(hào)找回來。
相關(guān)文章
2019智能電視引領(lǐng)智能語音助理的增長(zhǎng) 中國(guó)移動(dòng)版語音助手全球獨(dú)占78%
2019智能電視引領(lǐng)智能語音助理的增長(zhǎng) 中…
松下2018電視現(xiàn)可支持Google智能助理和亞馬遜Alexa
松下2018電視現(xiàn)可支持Google智能助理和…
郝亞斌:智能電視開啟行業(yè)“新藍(lán)?!? />
						</a>
			<div   id= 郝亞斌:智能電視開啟行業(yè)“新藍(lán)?!?/a>
公安領(lǐng)域迎來黑科技!智能語音識(shí)別技術(shù)服務(wù)公安機(jī)關(guān)
公安領(lǐng)域迎來黑科技!智能語音識(shí)別技術(shù)…
OPPO Find X AI語音助手 讓你“動(dòng)口不動(dòng)手”
OPPO Find X AI語音助手 讓你“動(dòng)口不動(dòng)…
谷歌高管:語音識(shí)別將是科技的下一次飛躍
谷歌高管:語音識(shí)別將是科技的下一次飛躍
我還沒有學(xué)會(huì)寫個(gè)人說明!

24小時(shí)排行