首頁 > 科技

抖音祕籍,對外開放

2021-06-11 12:33:20

金磊 魚羊 發自 凹非寺 量子位 報道 | 公眾號 QbitAI

「這一天終於還是來了……」

位元組跳動,這個站在短視訊風口的巨鱷,終究把憋了數載的功力釋放了出來:

火山引擎。

至此,抖音、西瓜、火山,能一次又一次成功掀起國民熱潮的祕籍,流入江湖,盡數開放

圖片

《抖音祕籍》,流入江湖

先來回答一個問題,何謂火山引擎

將名字拆分來看:

火山之意:先蓄勢,後爆發,並持久地爆發能量。引擎之意:先輸入,後輸出,並持續地提供動力。

簡而言之,火山引擎要做的,就是把位元組跳動成立至今的,與「增長」相關的場景、技術、方法論等分享出來。

火山引擎就像是一扇開啟的窗戶,能讓外界的人直接看到位元組跳動技術的實質。

那麼大火的抖音,它的致勝法寶又是什麼?

這本祕籍,叫做《AI智慧體驗套件》

圖片

祕籍全本共分為四大篇章

第一篇章:特效場景

抖音作為一個內容創作平臺,一個關鍵點,就是使用者既是消費者,又是生產者。

要想提升平臺的活躍度,抖音在這一篇章主要修煉了兩大功力:

消費者轉化成生產者:智慧視覺特效和智慧創作,可以降低高效生產的門檻。精準內容分發:通過推薦演算法,提升視訊的消費。好玩、有趣的AI特效,無疑是抖音爆火的一大原因。

短視訊場景下,利用生成對抗網路演算法的「只有淡妝」,成為了近期的一大爆款。

圖片

使用者們對於這種清新、自然的AI上妝效果,非常買賬,直呼「建議焊在臉上」。

並且還通過標籤聯動的方式,讓特效成為熱點,更多的使用者會參與進來,使其價值發揮到最大。

而這個AI特效,僅僅是上線了18天,便達到了抖音內部評級的S級

再例如地標AR,讓上海東方明珠、廣州塔、西安鐘樓等地標性建築「動起來」。

使用者只需要掃描相應的建築,就可以體驗到動態、別樣的地標AR效果。

圖片

這一AI特效不僅僅增加了使用者的娛樂體驗,更是提高了文旅場景商業化的收益。

還有在直播場景下,抖音通過一系列的特效,為主播們定製個性化的「禮物」,提高觀眾與主播間的互動體驗。

還有對於不願意露臉的主播,抖音也通過Animoji虛擬形象功能,可以貼合主播自身的形象。

圖片

另外,通過觸發雲渲染技術,將渲染工作轉嫁到雲端,還可以解決下沉市場一些主播因為手機終端算力不足,在特效玩法上受限的問題。

而且為了提升畫質,還採用了自研的演算法實現自適應銳化。

第二篇章:特效演算法

從第一篇章中不難看出,AI特效已經深入到了抖音的各種場景。

而在此背後,抖音所修煉的功法,便是特效演算法

AI特效能不能呈現好的效果,演算法適配格外的重要。

因為演算法本身是一個比較敏感的模型,模型本身又需要一定的泛化能力。

然而現實場景非常紛繁複雜,人物在視訊中的近中遠距離、全身半身,錄製時的橫豎屏、室內室外光照,以及實時、非實時的處理要求。

圖片

這些因素都會影響演算法所產生的結果。

因此,在不同的場景之下都會有不同的工程優化

例如適配高中低端晶片,提升機型覆蓋率;移動端大屏主機端,平臺模型差異化等等。

而要想達到上述的要求,背後所擁有的基礎演算法需是「方方面面」。

大方向如人臉識別、人體識別、手勢識別,以及影象分割等等。

而再細分下來,所涵蓋的演算法內容則會更多,一張圖來感受一下。

圖片

第三篇章:特效引擎

《抖音祕籍》的第三篇章就是特效引擎。

所修煉的內容,首先就是多平臺支援

畢竟做移動端的生意,就需要在各種場景下都能玩得起來。

因此演算法不僅僅是在App上能產生效果,也能落在瀏覽器、小程式等場景。

為此,抖音進行了移動端SDK開發,甚至還採用了雲渲染這種比較重的方法去解決問題。

其次,特效引擎中的另一大重點,便是3D渲染GAN等硬技術。

圖片

細分來看包括物理引擎模擬、動畫系統、虛擬形象等等。

這些工作讓玩法從2D向3D轉化,加速了CG級特效玩法落地移動終端。

圖片

當然,例如GAN等技術,也大大縮短了特效的生產週期。

圖片

第四篇章:特效工具

敲黑板,這一篇章是抖音祕籍中的重中之重

原因如下:

特效的生產效率,對於特效能不能落地業務起著決定性的作用。

為此,技術團隊主要做了三件事情:提升生產效率、完善設計生態,以及引擎同步升級。

2D、3D、美顏等特效,若是一個人需要花費好幾天的時間來完成,恐怕對於抖音這種體量業務,是完全hold不住的。

為此,位元組內部開發出了自己的生產工具,其底層和SDK都是同樣的引擎,可以幫助設計師用無程式碼的方式,快速地生產特效。

有多快?

平均1天生產2D特效,5天生產3D特效。

圖片

最重要的是這種工具還是對外開放的那種,可以連結外部設計師,起到反哺的效果,合力提高生產的效率。

至此,四大篇章介紹完畢。

可說了這麼多,這樣祕籍究竟能帶來什麼樣的增效?

火山引擎AI組計算機視覺方向工程師王坎分享了這樣一個案例:

火山引擎有一個短視訊客戶。產品原來運行了一年,才能積攢下小几十個玩法或特效貼紙。在用了火山引擎的工具+引擎之後,設計師一週就能設計出5-6套妝容,或者一天一個2D特效,上新速度有肉眼可見的提升。

基本上能在保持原先特效團隊規模不變的基礎上,讓產量增加十倍有餘。

火山為何現在「噴發」

那麼問題來了。

位元組跳動有足夠好用的內部工具,在外部亦有探索實踐,但為什麼是在現在這個時間節點,選擇對外「噴發」?

圖片

按照位元組跳動副總裁楊震原的說法,其實早在2017年,位元組跳動就已經開始對外開放自家大名鼎鼎的推薦演算法。

但這樣的ToB業務,在2020年之前,一直是「單點嘗試」,遠算不上是一項主業。

2020年,位元組跳動才打出了火山引擎這張牌,正式啟動ToB業務。

而現在,火山引擎在低調運行一年之後,終於來了一波強勢「噴發」,高調展示了自己入局智慧化/數字化服務市場的姿態和野心。

圖片

巨頭入場,自然分外引人關注。更何況,在現在這個時間節點,企業技術服務市場的競爭正日趨激烈——根據IDC資料,尤其是在更偏向底層的IaaS(基礎設施即服務)+PaaS(平臺即服務)市場上,高集中度競爭格局已然形成,在2020年上半年,阿里雲、騰訊雲和華為雲就已經佔據了62%的市場份額。

所以,為什麼是現在?

楊震原將來自外部的因素歸結為三點:

第一個,是客戶對位元組跳動的技術和工具很感興趣。第二個,位元組跳動有很多數字化增長的實踐。第三個,看中國市場的情況。從大的方向來看,企業向數字化、向智慧化演進的速度在變快。因此,工具市場空間變得非常大。

以CV技術為例,就有AI產業觀察人士指出:「近幾年來,在特效玩法這樣的應用領域,國內幾乎沒有誰做得比抖音更好。」

圖片

一方面,位元組跳動掌握從演算法到場景(如抖音、輕顏等)的全鏈條,能夠在內部運行從演算法研發到使用者反饋的整個過程。

更重要的是,抖音作為一個DAU早已突破6億的國民級App,本身就是一個對技術服務有著極大需求的業務場景,對於面向B端的技術產品而言,可以說是一塊絕佳的試金石。

基於龐大的使用者基數、海量的分析資料,位元組跳動的技術團隊在驗證技術的場景價值方面,擁有天然的優勢。王坎也談到,火山引擎CV的最大競爭優勢,就是可以複用內部已有的實驗場景中成熟的生產流程。

一個玩法能不能火,要看生產工具是否穩定,這就需要試驗田。我們內部已經充滿了這樣的試驗田,我們在已經運行穩定的產品上,抽象出知識和架構,提供給外部,這是我們最核心的優勢。

圖片

而如果僅從位元組內部的視角來看,核心的原因還是,「內部產品打磨出來了」。

王坎認為,位元組內部掌握一個技術,跟對外提供一個ToB的服務,難度不在一個重量級。

因為在內部,技術實踐可以更激進,但在ToB產品裡,穩定性才是第一位的。

楊震原則舉了AWS的例子:

我們把AWS當作楷模。它把內部的東西做好,進一步提高質量,提供給外部的客戶,又通過外部客戶把內部產品打磨得更好,反過來更好地服務於自身的使用者。把技術開放出去對一家科技公司來說,也是有很大價值的。要想建設高標準的技術團隊,就要把「後衛」變成「前鋒」,讓公司內部中臺出去看看外部的市場,去迎接更多的客戶,這樣才能真正打磨出好的團隊。

如何評價火山引擎?

在面向個人使用者的業務場景裡,位元組跳動已然證明了自己,此番公開揭起ToB大旗,又是否會對行業格局造成新的衝擊?

至少楊震原說:

位元組跳動的增長沒有祕密。

支撐位元組業務狂奔的所謂「祕密」,就是紮實的基礎設施,而現在,通過火山引擎,這些技術和工具本身不再被神祕的面紗籠罩。

圖片

不過,楊震原也坦承,把事情做成功的關鍵,除了技術、工具,核心還是要靠企業自己,服務好使用者、創造出價值。

火山引擎能做的,是把數字化的理念和工具做好,更好地服務和支援大家。

而位元組跳動是否真的沒有祕密,接下來,就看火山引擎的了。

(應受訪者要求,文中的「王坎」為化名)


IT145.com E-mail:sddin#qq.com