阿里巴巴副總裁、阿里大文娛優(yōu)酷CTO莊卓然發(fā)表演講。
長期提供內容分發(fā)的視頻網(wǎng)站正在尋求技術上的突破,這被視為網(wǎng)絡視聽產業(yè)爆發(fā)式增長后的一種差異化競爭方式,其用戶正在切身感知這種體驗的變化。
率先發(fā)力的是優(yōu)酷,該公司在6月開賽的世界杯上引入了新的功能模塊。在比賽直播轉播期間,根據(jù)“進球就下紅包雨”的活動規(guī)則,為用戶提供實時互動。在保障直播本身高清、流暢的同時,對優(yōu)酷后臺支撐技術是極大的考驗。
在優(yōu)酷部署了自主研發(fā)的“智能媒體大腦”系統(tǒng)、阿里云密集的CDN節(jié)點和海量帶寬存儲支持下,北京時間6月14日晚,在世界杯直播第一天,其移動端新用戶環(huán)比增長160%,當日整體活躍用戶也隨之環(huán)比增長20%,直播累計觀看用戶超過了1200萬。這一成績得到阿里巴巴副總裁、阿里大文娛優(yōu)酷CTO莊卓然的肯定。
直播首日觀看用戶超千萬
成為具有世界杯直播權的網(wǎng)絡視頻平臺后,優(yōu)酷部署了自主研發(fā)的“智能媒體大腦”系統(tǒng)、阿里云密集的CDN節(jié)點和海量帶寬存儲支持。除了首場比賽流量暴增導致短時間卡頓以外,后續(xù)比賽均未出現(xiàn)異常。
優(yōu)酷披露的一組數(shù)據(jù)顯示,世界杯直播第一天,移動端新用戶環(huán)比增長160%,整體活躍用戶也隨之環(huán)比增長20%,直播累計觀看用戶超過了1200萬。莊卓然肯定了這一成績,但他表示,兩個星期的時間難以做深度的技術重構,所以過去的積累就更加重要。
從基礎設施搭建、產品快速研發(fā),應用呈現(xiàn)方式以及最后的運營保障,“我們希望手機上看和電視上有不一樣的體驗,希望有更強的互動性和更多的趣味性”,阿里巴巴副總裁、阿里大文娛優(yōu)酷CTO莊卓然告訴記者,“兩周時間我們去嘗試,這個過程不斷地迭代”。
莊卓然表示,世界杯與網(wǎng)絡綜藝類似,都具備強資訊、話題和互動的屬性,這就需要傳統(tǒng)廣電鏈路傳輸和互聯(lián)網(wǎng)融媒體基礎設施結合,在渲染、交互、處理和生產幾個環(huán)節(jié)更加智能化。
事實上,中國文娛行業(yè)正處在發(fā)生巨變的前夜,這不僅將改變視頻網(wǎng)站的生產和商業(yè)模式,而且整個產業(yè)也會因技術的差異,重塑市場競爭格局。“相對于美國來說,中國產業(yè)的工業(yè)化很低,但互聯(lián)網(wǎng)程度高,因此對整個產業(yè)升級是一個新的機會”,莊卓然說。
引入“智能媒體大腦”
與以往淘寶網(wǎng)紅直播的以人為中心的營銷場景不同,世界杯這樣的大型體育賽事直播,必須要保證信號的清晰度和流暢性。不能等電視用戶已經大聲歡呼,網(wǎng)絡用戶仍是一片平靜,這將極大消耗用戶的期待,最終導致用戶流失。
然而,網(wǎng)絡直播與電視直播最大的差異在于物理介質導致的內容播放延遲。在物理極限不能突破的當下,通過技術手段縮短延遲則是視頻網(wǎng)站的必備能力。在接手世界杯直播項目時,留給莊卓然的時間只有兩個星期去解決高頻運動畫面的清晰度和流暢度問題。
目前,支撐優(yōu)酷世界杯直播的團隊包括了自身產品技術團隊、阿里云團隊以及天貓雙十一的技術保障團隊,這些團隊組成了專門的項目組。莊卓然告訴記者,但在這些團隊之外,對世界杯觀看體驗提升,“智能媒體大腦”無疑扮演了重要的助力者的角色。
所謂“智能媒體大腦”,其具備高質量多媒體內容的智能生產、大規(guī)模網(wǎng)絡資源的智能調度及實時流媒體的智能編碼與動態(tài)渲染等能力,包括智能編解碼、智能調度、智能交互、智能處理、智能生產五大引擎,覆蓋內容生產、分發(fā)、消費與交互場景。
其中,智能編解碼引擎被用于解決高清晰度的問題。這并不是一個新技術,其也被稱為“窄帶高清2.0”,已廣泛應用在優(yōu)酷平臺。但在針對世界杯直播時,技術團隊針對賽事直播場景基于機器學習進行優(yōu)化,比如針對足球、草地和球員分別采用特別的編碼策略優(yōu)化,大幅提升了畫面的層次感和通透性。
為了保障觀賞的流暢和穩(wěn)定性,智能調度引擎則針對移動、PC、OTT等不同客戶終端,從硬件設備、網(wǎng)路帶寬和用戶行為等多個維度對帶寬使用行為進行精準預測和控制,這種多協(xié)議多策略的調度模型,最終可以針對復雜的網(wǎng)絡環(huán)境,提供流暢的內容傳輸和展現(xiàn)。
針對使用場景,優(yōu)酷則調用了智能交互引擎擴充互動場景。該引擎支持球員定位與追蹤、戰(zhàn)術軌跡分析、球員身份識別等功能,可以增強比賽本身所特有的信息,與此同時,可以提供用戶之間實時交流通信的特有功能。
標注同樣用于基礎動作。莊卓然表示,首先通過系統(tǒng)對射門、撲救等動作打標簽。當智能系統(tǒng)累積到一定量級的訓練后,再給系統(tǒng)一段視頻,系統(tǒng)就會自動識別出動作、人物和場景,并對其精彩程度打分。這樣智能生產引擎就能快速剪輯視頻。
莊卓然透露,今年優(yōu)酷世界杯短視頻內容有20%是通過該系統(tǒng)自動剪輯。不僅如此,智能生產引擎同樣可以應用于影視劇、綜藝、動漫等其他內容精彩片段的快速制作,便于內容的宣推。
此外,智能處理引擎還可以切換不同直播聲道,用戶可以選擇原版解說之外的,還可以選擇跨界明星和特色粵語解說服務。
內容產業(yè)正在升級
各平臺制作的互聯(lián)網(wǎng)原生綜藝已出現(xiàn)大規(guī)模井噴的態(tài)勢,僅過去一年就出現(xiàn)了159部網(wǎng)絡綜藝,平臺投資額翻倍增長。伴隨人工智能、大數(shù)據(jù)和云計算產業(yè)的不斷發(fā)展成熟,新的技術已融入傳統(tǒng)的內容生產每一個環(huán)節(jié)。
莊卓然表示,優(yōu)酷重塑了整個內容采買、策劃、營銷,以及廣告體系,而互聯(lián)網(wǎng)技術對頭部內容的消費能力正在增強,同時迸發(fā)出更多元的商業(yè)機會。
“子彈時間”是一種常用于電影、電視劇、廣告或游戲的一種視覺特效,結合攝影技術與后期特效可以模擬出慢鏡頭、時間停止等畫面。最經典的應用場景是華納兄弟電影公司出品的電影《黑客帝國》,其中男主角Neo仰身躲子彈的慢動作鏡頭堪稱經典。
當時電影拍攝時,使用了120臺高速攝像機,并且每秒拍攝120個鏡頭,這相當于1.4萬多幀的畫面,并需要通過后期復雜的剪輯才能完成,是一個成本昂貴的制作。但優(yōu)酷只需通過40臺普通相機對場景進行捕捉,再經過自研算法計算,即可獲得三維場景轉化的效果。
在內容生產階段,優(yōu)酷已經將“子彈時間”的技術應用于《這就是街舞》、《這就是鐵甲》等當下網(wǎng)絡綜藝節(jié)目中。莊卓然表示,技術的演進不僅是簡單的智能推薦和宣發(fā),而是為用戶提供極致的視頻觀看體驗。
對于內容分發(fā),優(yōu)酷亦借助技術從人找內容到內容找人的轉變。2017年,優(yōu)酷實現(xiàn)全站的個性化推薦分發(fā),用戶觀看視頻播放量和觀看時長分別提升了30%和10%。
不僅如此,優(yōu)酷還推出了“魚腦”、“鯨觀”等平臺。其中,優(yōu)酷2017年構建的泛內容大數(shù)據(jù)智能預測平臺——“魚腦”,可提前內容生命周期各個環(huán)節(jié)進行預測,角度包括流量、流量、明星、話題、事件等,目前已開始為內容投資制作、營銷運營,甚至廣告商業(yè)化賦能。
真人秀節(jié)目《這就是街舞》就引入了“魚腦”平臺。制作方通過對受眾以往觀看內容的數(shù)據(jù)進行分析和對比,選出了易烊千璽作為節(jié)目嘉賓,隨后的新聞熱點亦圍繞其展開。節(jié)目播出期間,“魚腦”發(fā)現(xiàn)臨別感言環(huán)節(jié)用戶的收視率大幅下降,工作人員隨后減少了這部分在節(jié)目中的比重,實現(xiàn)了調整和優(yōu)化。
過去憑借專家、直覺和感性對內容的價值做出判斷,而現(xiàn)在通過技術實現(xiàn)。莊卓然表示,“魚腦”這類大數(shù)據(jù)平臺是為“大腦”接上“神經”,整體運作將有更加清晰的判斷。此次,優(yōu)酷披露《這就是街舞》數(shù)據(jù)顯示,截至5月底該節(jié)目播放量達9億,產生話題30億個。
事實上,過去一年,阿里巴巴旗下包括優(yōu)酷、UC和游戲在內大文娛板塊不再僅局限于內部協(xié)同,而是開始與阿里巴巴電商等多業(yè)務線協(xié)同。經過技術基礎設施、人才團隊和商業(yè)生態(tài)的進一步融合,優(yōu)酷正在加速落地“好萊塢+硅谷”模式。
目前,阿里巴巴尚未披露參與世界杯營銷的天貓等其他業(yè)務線銷售成績,但莊卓然告訴記者,“這背后的宣推矩陣擁有的想象空間巨大”。