国产精品奶水无码视频免费|激情五月天深爱网|精品国产女主播一区在线观看|国产黄网一区二区

當(dāng)語(yǔ)音識(shí)別撞上方言,誰(shuí)比誰(shuí)懵逼?

2017-08-04 16:18:33 來(lái)源:慧聰安防網(wǎng) 熱度:
這幾年,各種各樣的技術(shù)和產(chǎn)品,就像地里的稻谷一樣,火了一茬又一茬。這不,近段時(shí)間,智能音箱又開(kāi)始強(qiáng)勢(shì)崛起,巨頭們紛紛瞄向智能音箱市場(chǎng),引起了新一輪的血雨腥風(fēng)。
   
這一切源于近兩年智能家居開(kāi)始流行的“解放雙手”,在這“解放雙手”的過(guò)程中語(yǔ)音識(shí)別是最關(guān)鍵的一環(huán),有很多人斷言沒(méi)有語(yǔ)音識(shí)別的的智能家居系統(tǒng)都是假智能家居。人們對(duì)于語(yǔ)音識(shí)別未來(lái)的發(fā)展充滿了信心,甚至在“語(yǔ)音識(shí)別”的百度百科中有這么一句話:人們預(yù)計(jì),未來(lái)10年內(nèi),語(yǔ)音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。當(dāng)然,小編同樣是語(yǔ)音識(shí)別的腦殘粉,對(duì)語(yǔ)音識(shí)別未來(lái)的發(fā)展前景充滿了美好的想象。不過(guò),在充滿信心的同時(shí),小編我不禁對(duì)一個(gè)問(wèn)題充滿了好奇:那些語(yǔ)音識(shí)別的巨頭企業(yè)一直在告訴大眾:我們的識(shí)別率已經(jīng)達(dá)到了95%了97%了,99%了,99.9%了!看他們打了雞血似的不斷更新這個(gè)數(shù)字,真是一件可喜可賀、喜大普奔的事情。但是,小編卻想歪個(gè)樓,識(shí)別率99%的語(yǔ)音識(shí)別搞得定方言嗎?
   
討論語(yǔ)音識(shí)別方言識(shí)別率的必要性
   
小編絕對(duì)不承認(rèn),這個(gè)問(wèn)題的討論僅僅是基于小編本人無(wú)處釋放的無(wú)聊。所以我們就先來(lái)確定一下討論這個(gè)問(wèn)題的必要性。對(duì)于國(guó)外的情況小編不是很了解,那咱們就來(lái)探討一下中國(guó)的方言情況。小編還記得大學(xué)時(shí)期《方言學(xué)》上課的第一天,我們那個(gè)漂亮的女教授說(shuō)的第一句話就是:我想大家一定都聽(tīng)過(guò)“十里不同音,百里不同俗”吧。十里不同音,這就是中國(guó)的語(yǔ)言現(xiàn)狀。在中國(guó),很多的人們說(shuō)著彼此幾乎無(wú)法交流的語(yǔ)言,作為南方人小編深有感觸,也許真的走出自己家的小鎮(zhèn),就聽(tīng)不懂當(dāng)?shù)厝苏f(shuō)的是什么了。普通話的普及也不過(guò)短短幾十年,各種方言混雜的情況實(shí)在是太常見(jiàn)了。
   
那中國(guó)究竟有多少種方言呢?中國(guó)共有56個(gè)民族,除了回族沒(méi)有自己的語(yǔ)言之外,其他所有民族都有自己的語(yǔ)言,這就有50多種,但這并不是全部,因?yàn)樵诟鱾€(gè)方言區(qū)中又分布著多種土語(yǔ)。據(jù)不完全統(tǒng)計(jì),中國(guó)至少有80種以上的語(yǔ)言。除此之外,由于受到方言的影響,很多人的普通話會(huì)有一定的口音存在。其實(shí)對(duì)于這一點(diǎn),小編真的很有話語(yǔ)權(quán)啊,因?yàn)樾【幤綍r(shí)對(duì)一些企業(yè)管理者進(jìn)行采訪之后,用語(yǔ)音識(shí)別軟件將錄音轉(zhuǎn)錄出來(lái)時(shí),小編就發(fā)現(xiàn)口音對(duì)于語(yǔ)音識(shí)別的干擾真的是非常非常大的啊。但是然并卵,小編的軟件賬號(hào)丟失了,所以這些記錄都找不回來(lái)了,無(wú)圖無(wú)真相啊。
   
語(yǔ)音識(shí)別的原理
   
好了,先忽略口音的問(wèn)題,讓我們回到方言識(shí)別這個(gè)問(wèn)題。我們先來(lái)看看語(yǔ)音識(shí)別的技術(shù)原理,所謂語(yǔ)音識(shí)別,就是將一段語(yǔ)音信號(hào)轉(zhuǎn)換成相對(duì)應(yīng)的文本信息(我們這里不討論作為安防手段的聲紋識(shí)別,而是討論以人機(jī)交互為目的的語(yǔ)音識(shí)別),系統(tǒng)主要包含特征提取、聲學(xué)模型,語(yǔ)言模型以及字典與解碼四大部分,其中為了更有效地提取特征往往還需要對(duì)所采集到的聲音信號(hào)進(jìn)行濾波、分幀等預(yù)處理工作,把要分析的信號(hào)從原始信號(hào)中提取出來(lái);之后,特征提取工作將聲音信號(hào)從時(shí)域轉(zhuǎn)換到頻域,為聲學(xué)模型提供合適的特征向量;聲學(xué)模型中再根據(jù)聲學(xué)特性計(jì)算每一個(gè)特征向量在聲學(xué)特征上的得分;而語(yǔ)言模型則根據(jù)語(yǔ)言學(xué)相關(guān)的理論,計(jì)算該聲音信號(hào)對(duì)應(yīng)可能詞組序列的概率;最后根據(jù)已有的字典,對(duì)詞組序列進(jìn)行解碼,得到最后可能的文本表示。
   
作為語(yǔ)音識(shí)別的前提與基礎(chǔ),語(yǔ)音信號(hào)的預(yù)處理過(guò)程至關(guān)重要。在最終進(jìn)行模板匹配的時(shí)候,是將輸入語(yǔ)音信號(hào)的特征參數(shù)同模板庫(kù)中的特征參數(shù)進(jìn)行對(duì)比,因此,只有在預(yù)處理階段得到能夠表征語(yǔ)音信號(hào)本質(zhì)特征的特征參數(shù),才能夠?qū)⑦@些特征參數(shù)進(jìn)行匹配進(jìn)行識(shí)別率高的語(yǔ)音識(shí)別。若果讓小編用一句話來(lái)進(jìn)行總結(jié)就是:對(duì)語(yǔ)音識(shí)別來(lái)說(shuō),給它足夠的數(shù)據(jù)量進(jìn)行學(xué)習(xí)是關(guān)鍵。
 
語(yǔ)音識(shí)別的方言識(shí)別率究竟如何?
   
那語(yǔ)音識(shí)別對(duì)于方言的識(shí)別情況究竟怎么樣呢?在寫(xiě)稿的時(shí)候,小編就近找了兩個(gè)同事(一個(gè)是湖北赤壁人,一個(gè)是湖南長(zhǎng)沙人以及小編本人是湖南邵陽(yáng)人)跟我一起進(jìn)行了一個(gè)簡(jiǎn)單的測(cè)試。
   
小編截取了這篇文章中的一段文字:那中國(guó)究竟有多少種方言呢?中國(guó)共有56個(gè)民族,除了回族沒(méi)有自己的語(yǔ)言之外,其他所有民族都有自己的語(yǔ)言,這就有50多種,但這并不是全部,因?yàn)樵诟鱾€(gè)方言區(qū)中有分布著多種土語(yǔ)。因此,據(jù)不完全統(tǒng)計(jì),中國(guó)至少有80種以上的語(yǔ)言。
   
小編讓同事分別用自己家鄉(xiāng)的方言念了一遍這段話,然后用微信的語(yǔ)音轉(zhuǎn)文字進(jìn)行轉(zhuǎn)寫(xiě),測(cè)試結(jié)果如下:

 
湖南長(zhǎng)沙同事的測(cè)試結(jié)果



湖北赤壁同事的測(cè)試結(jié)果
 
然后,小編其中一個(gè)多才多藝的同事表示,這樣的測(cè)試結(jié)果太慘絕人寰了,而且她覺(jué)得這樣催人淚下的結(jié)果,主要是因?yàn)槲覀冋f(shuō)的話都太土了,于是她又用標(biāo)準(zhǔn)的武漢話念了一遍……
當(dāng)語(yǔ)音識(shí)別撞上方言,誰(shuí)比誰(shuí)懵逼?
   
我還能說(shuō)什么呢?微信用的可是現(xiàn)在最火的訊飛輸入法。最后,小編又用普通話念了一遍這句話,算是為語(yǔ)音識(shí)別強(qiáng)力挽了一把尊,99%的識(shí)別率其實(shí)并不算是吹的。
 
   
當(dāng)然,小編的這個(gè)討論是國(guó)際化的,不可能僅僅局限于中國(guó)方言,接下來(lái)我們來(lái)看看國(guó)外的情況。不久前,一位來(lái)自美國(guó)的消費(fèi)者最近投訴亞馬遜Alexa:它并不能識(shí)別自己老媽的口音。“這些軟件似乎聽(tīng)不懂我在說(shuō)什么。”這位母親如是說(shuō)。面對(duì)母親的抱怨,這位美國(guó)消費(fèi)者決定向亞馬遜反應(yīng)這一問(wèn)題。這件事情肯定會(huì)讓人想起Siri,盡管蘋(píng)果在每次發(fā)布會(huì)上都似有似無(wú)的提到一句“我們又提升了Siri的識(shí)別率”,但實(shí)際效果正如大家所看到的這樣,有的時(shí)候它真的無(wú)能為力。不僅如此,小編記得在看《非正式會(huì)談》的時(shí)候,其中一個(gè)日本嘉賓就嘲笑過(guò)另一個(gè)日本嘉賓的大阪口音,而一個(gè)美國(guó)嘉賓也嘲笑過(guò)一個(gè)美國(guó)嘉賓的俄亥俄州口音,所以說(shuō)這個(gè)方言和口音的問(wèn)題真的是一個(gè)全球性的問(wèn)題,語(yǔ)音識(shí)別任重而道遠(yuǎn)啊。
   
慧聰安防網(wǎng)總結(jié)
   
雖然小編在前文中說(shuō),這篇文章源于小編的無(wú)聊,但是小編必須嚴(yán)肅地說(shuō):我所討論的這個(gè)問(wèn)題是具有非常大的現(xiàn)實(shí)意義的。以中國(guó)為例,因?yàn)槠胀ㄔ挼耐茝V時(shí)間太短,導(dǎo)致很多上了年紀(jì)的人基本不會(huì)講普通話,而且,這樣的人群并不在少數(shù)。當(dāng)然,現(xiàn)在很多語(yǔ)音識(shí)別系統(tǒng)都會(huì)考慮到方言的搭載,但是不得不說(shuō)這是一個(gè)很漫長(zhǎng)的過(guò)程。
   
但是這還不是語(yǔ)音識(shí)別應(yīng)用推廣最大的問(wèn)題,事實(shí)上,在小編看來(lái),口音問(wèn)題可能會(huì)是語(yǔ)音識(shí)別應(yīng)用更大的問(wèn)題。和在這個(gè)測(cè)試中,小編與同事使用純方言這樣極端的情況不同的是,口音問(wèn)題在我國(guó)是一個(gè)非常普遍存在的問(wèn)題,尤其是在我國(guó)南方,很多人都帶有口音,而小編的經(jīng)驗(yàn)告訴我,對(duì)于這些有一定口音的普通話識(shí)別,語(yǔ)音識(shí)別技術(shù)很難做到99%,能達(dá)到70%的識(shí)別率就很不錯(cuò)了?;蛟S這會(huì)是小編的下一篇原創(chuàng)的主題,不過(guò)前提是我得先把訊飛聽(tīng)見(jiàn)的賬號(hào)找回來(lái)。

責(zé)任編輯:吳一波

相關(guān)推薦

浦城法院?jiǎn)⒂猛徶悄苷Z(yǔ)音識(shí)別系統(tǒng)

“現(xiàn)在開(kāi)庭!”12月19日上午,隨著一聲清脆的法槌聲,一起定金合同糾紛案件在浦城縣法院開(kāi)庭審理。審判員話音未落,電腦顯示屏上就同步出現(xiàn)漢字:“審判員:現(xiàn)在開(kāi)庭”。與以往不同的是,這次庭審看不到書(shū)記員在忙碌的打字記錄,但電腦顯示屏上記錄著庭審中審判員和訴訟參與人說(shuō)的每一句話。庭審一結(jié)束,當(dāng)事人就可以核對(duì)后在庭審筆錄上簽字。筆錄怎么形成的呢

西媒:中國(guó)人工智能實(shí)力可比肩美國(guó) “雙寡頭”局面已到來(lái)

西媒稱,擴(kuò)音器識(shí)別出了使用者的聲音,并逐漸降低了音量;在人聲的指揮下,窗簾打開(kāi)或關(guān)閉,空調(diào)系統(tǒng)依據(jù)指定的溫度開(kāi)啟,吸塵器自動(dòng)關(guān)閉??拼笥嶏w是一家專門(mén)從事語(yǔ)音識(shí)別技術(shù)研發(fā)的公司,旗下?lián)碛屑s2000種使用語(yǔ)音識(shí)別技術(shù)的產(chǎn)品。中國(guó)政府已經(jīng)正式將該公司認(rèn)定為人工智能領(lǐng)域的領(lǐng)軍企業(yè)。據(jù)西班牙《國(guó)家報(bào)》網(wǎng)站12月24日?qǐng)?bào)道,中國(guó)正經(jīng)歷一場(chǎng)真正的人工