圖為 金山云金睛AI首席算法架構(gòu)師蘇馳博士
金山云的全方位內(nèi)容安全監(jiān)管
目前我國的網(wǎng)民已經(jīng)超過8億,互聯(lián)網(wǎng)的普及率接近60%,這也導(dǎo)致每天產(chǎn)生海量的網(wǎng)絡(luò)視頻的文本,其中不乏一些暗流,也就是所謂的黃色、恐怖、違規(guī)、或者是涉政敏感的內(nèi)容,所以內(nèi)容安全是整個企業(yè)的生死線也是國家監(jiān)管的紅線。
而針對這一現(xiàn)象,過去的解決方法主要以人工審核和用戶舉報為主,但是效果并不明顯,蘇馳介紹到:“金山云的內(nèi)容安全監(jiān)管是全方位的,包括文本、語音、圖像、視頻等。”
首先對于文字來說,金山云有大量的數(shù)據(jù)可以進行語音分析和深度學(xué)習(xí)的處理,把涉政,色情、暴恐以及隱藏特別深晦的東西分析出來。
金山云“金睛”在云服務(wù)的豐富底層資源上,借助每日千萬級海量圖片庫訓(xùn)練出精準(zhǔn)AI算法模型,對違規(guī)場景進行精細(xì)化標(biāo)簽,目前分別支持80+低俗和色情場景、200+暴恐類標(biāo)簽識別、1200+敏感人物等六大違規(guī)場景的精準(zhǔn)識別,10億精標(biāo)數(shù)據(jù),毫秒級響應(yīng)速度,即發(fā)即審,免去平臺突發(fā)的內(nèi)容風(fēng)險。
除此之外,金山云也開發(fā)了人臉識別系統(tǒng),包括主播黑名單和主播白名單,主播白名單有主播的身份庫,直播的時候需要先進行認(rèn)證。而一旦進行了黑名單,通過人臉識別之后,直播的內(nèi)容將無法播放,這是對于直播平臺主播實時的監(jiān)控系統(tǒng)。
不僅如此,圖像和視頻處理完之后還將通過相關(guān)的語音識別技術(shù),看看有沒有主播詐騙的信息,語音轉(zhuǎn)寫時有無敏感詞等等。
圖像分類和OCR文字識別技術(shù)
先前講到內(nèi)容監(jiān)管應(yīng)該怎么做,但是遇到問題時該怎么解決呢?目前每天在互聯(lián)網(wǎng)上都會有黃色和恐怖的圖片,但是樣本非常小,其次標(biāo)簽規(guī)也不統(tǒng)一。蘇馳介紹說:“金山云采用的是圖片分類技術(shù)為多模態(tài)分析,該技術(shù)同時針對包括圖像、文本和語音,只要這三條有一條不合格就不行。”
說到多模態(tài)分析,蘇馳以視頻舉例到:“我們對視頻進行統(tǒng)一分析,首先得到圖片,我們會圖片分類過OCR產(chǎn)生文本,然后得到音頻信息,音頻信息要過音頻分類,這四塊處理之后我們只要找到一個進行違規(guī)我們會輸出違規(guī)反饋給客戶,同時告訴客戶我們在哪塊進行違規(guī),這個到底是因為什么原因違規(guī)。”
另外開放數(shù)據(jù)帶來的問題網(wǎng)絡(luò)圖片、分辨率、碼流、碼率完全不一樣,有可能特別小的手機截圖,或者是4K的截圖,或者是一個微信長視頻的截圖,這塊我們怎么處理,我們會有一個尺度判斷,來一張圖片之后我們對尺度判斷,通過判斷會把它放到不同的分辨率進行預(yù)測的結(jié)果。
OCR文字的識別技術(shù)主要檢測的是長視頻彈幕。蘇馳介紹到:“對于文本處理我們有多旋轉(zhuǎn)方向的文本檢測模型做訓(xùn)練,同時會采集生成達(dá)到千萬量級的標(biāo)準(zhǔn)做文字檢測。”
精準(zhǔn)度+全維度的內(nèi)容監(jiān)管優(yōu)勢
金山云對于內(nèi)容監(jiān)管有核心優(yōu)勢體現(xiàn)在精準(zhǔn)的識別度以及全維度的解決方案,蘇馳表示:“我們訓(xùn)練數(shù)據(jù)級達(dá)到百億,無論是視頻直播、點播、軟視頻、資訊類的內(nèi)容我們都有不同場景的模型做專業(yè)的配置。”
不僅如此,金山云線下有專業(yè)的售后專家團,每天的日報,每周的周報,每月的月報都會對公司業(yè)務(wù)進行重新的修正。