視頻現(xiàn)已成為人們娛樂生活中不可或缺的一種方式,為了提升用戶在拍攝時的體驗,國內(nèi)外都在不斷迭代更新著自家應用。近期谷歌的AI技術又帶來了一種全新玩法,通過AI技術實現(xiàn)對視頻背景的分離。
視頻分割(摳像)技術是并不是什么新鮮事物,過去一些導演和視頻制作者常用該技術對場景的前景與背景進行分離,通過此類手法,能夠讓視頻中一些內(nèi)容變得更為‘吸睛’。
只不過以往這是一種耗時的人工行為,現(xiàn)今谷歌通過機器學習能力,對成千上萬的圖像進行了注釋,包括頭發(fā),眼鏡,頸部,皮膚,嘴唇等前景元素的像素精確位置。也就是說,只需要通過簡單的觸控操作,便可進行背景更換。
為了提高速度,谷歌在網(wǎng)絡體系結構上也進行了改進,使用四倍以上的大卷積內(nèi)核來檢測高分辨率RGB輸入幀上的對象特征,并將網(wǎng)絡中間的信道擠壓四倍,將256個信道減少到64個的同時也不會對質量產(chǎn)生影響。
目前該技術已在YouTube上進行了測試,遺憾的是僅對少數(shù)YouTube播主進行了開放,同時這些主播還要是YouTube Stories的用戶。