6月15日,NAB Show Shanghai及第24屆白玉蘭國際廣播電視影視技術(shù)研討會(IBTC2018)在上海隆重召開,本次會議以“智融合·創(chuàng)未來——智慧廣電的發(fā)展與趨勢”為主題。2018年媒體業(yè)將加快媒體深度融合,整體轉(zhuǎn)型,通過對互聯(lián)網(wǎng)大數(shù)據(jù)、人工智能等新技術(shù)的有效利用、積極參與到智慧社會的建設(shè)中,賦予廣播電視“智慧”發(fā)展新動能,推動廣播影視全業(yè)務(wù)、全流程、全網(wǎng)絡(luò)向智能化、智慧化創(chuàng)新轉(zhuǎn)變,進(jìn)而共同促進(jìn)中國電視事業(yè)和媒體產(chǎn)業(yè)可持續(xù)發(fā)展。
會上,索貝售前業(yè)務(wù)部經(jīng)理詹楓以《融合媒體的人工智能(AI)實(shí)踐》為題發(fā)表了精彩的演講。
圖為:索貝售前業(yè)務(wù)部經(jīng)理詹楓
索貝技術(shù)一直在發(fā)展,在關(guān)鍵性項(xiàng)目中,索貝對技術(shù)是開放的,利用技術(shù)引領(lǐng)創(chuàng)新,應(yīng)用到行業(yè)領(lǐng)域里面,用國際視野方式,更加專注深層次的研發(fā)。
目前階段,融合媒體發(fā)展是趨勢,下一步進(jìn)入大的云平臺、大數(shù)據(jù)、大識別時代,索貝更加專注于技術(shù)儲備,專注視頻技術(shù),視頻+智能+云計(jì)算技術(shù)是要關(guān)注的重點(diǎn)。視頻本身是一個高級媒體表現(xiàn)形式,人工智能和大數(shù)據(jù)可融合在一起發(fā)展。
詹楓表示索貝的相關(guān)技術(shù)屢獲國際大獎,目前索貝自有所有系統(tǒng)產(chǎn)品全部遷移這樣的架構(gòu)上面,這是索貝面向行業(yè)的姿態(tài),把傳統(tǒng)架構(gòu)所有技術(shù)全部遷到這個上面來適配。
4K之后,索貝推出很多實(shí)際處理大視頻的效果技術(shù)手段。索貝考慮人工智能要在數(shù)據(jù)支撐情況下關(guān)注算力和算法,實(shí)現(xiàn)工智能和大數(shù)據(jù)平臺結(jié)合在一起。索貝提出了軟件電視臺概念,下一步走向融合,索貝思考怎么運(yùn)用這樣平臺真正意義上做到信號域和文件域之間需要解決的原來多次轉(zhuǎn)換的復(fù)雜度問題,信號域和文字域的同步,信號域和文文件域轉(zhuǎn)換過程中有哪些同步問題和轉(zhuǎn)換問題。
智能在解決語音事業(yè)、圖像事業(yè)和語義識別上有著重要的發(fā)揮,利用算法找到它的運(yùn)算機(jī)制,找到運(yùn)行模式,進(jìn)而把智能算法運(yùn)用各種軟件體系里面各個環(huán)節(jié)里面,去找到相應(yīng)的關(guān)聯(lián),索貝要秉持開放的心態(tài),利用主流框架在這個平臺進(jìn)行學(xué)習(xí)。
人工智能的應(yīng)用場景可以切分為關(guān)鍵應(yīng)用場景和非關(guān)鍵應(yīng)用場景。關(guān)鍵應(yīng)用場景如谷歌無人駕駛、自動駕駛2009連立項(xiàng),目前沒有商業(yè)化,這個里面對人工智能準(zhǔn)確度要求非常高。無論是控制管理還是業(yè)務(wù)管理,用到人工智能不需要多大精度,需要人工智能輔助人們生產(chǎn)。通過人工智能的輔助以及綜合性的評判,可以提升效率。
人工智能開源技術(shù)平臺建設(shè)和還源開放度正在進(jìn)行中,人工智能門檻已經(jīng)比較低,跟互聯(lián)網(wǎng)開源技術(shù)開放性有很大的關(guān)系。有很多公司都在利用,不光算法開源,包括訓(xùn)練集、測試集很方便做到,這可使得行業(yè)將人工智能大力的轉(zhuǎn)化為生產(chǎn)力。
索貝采用了開源學(xué)習(xí)框架并結(jié)合數(shù)據(jù)進(jìn)行深度學(xué)習(xí),應(yīng)用到了人工智能場景里面去。與BAT相比,行業(yè)縱深才是優(yōu)勢,索貝努力解決行業(yè)里面的應(yīng)用場景,這是我們廠商的優(yōu)勢。比如融合媒體視頻匯聚、內(nèi)容審核,涉及到導(dǎo)入視頻事業(yè),可基于集訓(xùn)練以后關(guān)鍵的基因提取進(jìn)行比對,能夠進(jìn)行正面人臉,并最終形成相關(guān)信息庫。
在機(jī)器學(xué)習(xí)訓(xùn)練中,先建立數(shù)據(jù)庫,隨后再進(jìn)行簡單結(jié)構(gòu)化文件對比。索貝采用各種智能技術(shù)應(yīng)用,進(jìn)行轉(zhuǎn)場識別、圖像識別,集成廠商優(yōu)勢,將多種輔助引擎設(shè)置到里面,以便于它獲取信息里面最優(yōu)化并找到最精確的東西,評估完成推出最精準(zhǔn)的業(yè)務(wù)效果,運(yùn)用各種識別技術(shù),這個應(yīng)景常用目前已廣泛應(yīng)用。
例如字幕識別功能,可將整體集成業(yè)務(wù)場景,并自動疊加,索貝擁有字幕關(guān)鍵提取功能,把關(guān)鍵部分提取出來,很快的形成圖片,方便應(yīng)用多媒體圖文互聯(lián)網(wǎng)發(fā)布出去。索貝把各種開放的智能引擎,開放智能框架都運(yùn)用到了場景里面,為廣電行業(yè)和電視臺解決具象化業(yè)務(wù),這是其初衷。