抖音的2017和它背后的黑科技
在剛剛過去的2017年里,如果要盤點整個 互聯(lián)網(wǎng) 行業(yè)最引人矚目的產(chǎn)品,抖音無論如何都會榜上有名。
從3月爆發(fā)起,抖音全年保持了令人震驚的增長態(tài)勢,以至于此前所有關(guān)于他將會曇花一現(xiàn)的預言統(tǒng)統(tǒng)落空。就在12月的月末,抖音更是實現(xiàn)了一波強勁地增長,順利登頂中國 App store 的免費榜。
事實上,早在9月,抖音就已經(jīng)進入了位居App Store攝影與錄像分榜第一,并進入總榜前十。而登頂之后,也并未迅速跌落,即使到了今天,抖音在 App Store 上仍僅次于支付寶和 微信 ,位列第三。
(抖音3月以來的百度指數(shù))
那么,抖音是如何能在2017年一路勢如破竹,甚至在年末戰(zhàn)勝微信、支付寶這樣巨頭登頂App Store的呢?
和外界大多數(shù)所分析推演的不同,來自抖音內(nèi)部的結(jié)論是,新技術(shù)新功能的不斷開發(fā)迭代是產(chǎn)品能夠持續(xù)走高的重中之重。
以歲末的這次登頂為例,抖音內(nèi)部歸功于產(chǎn)品新推出的功能玩法。12月21日,抖音的新版本上線了名為”尬舞機”的功能,上線的第二天,抖音就成功登頂。
是什么讓抖音在2017年實現(xiàn)了現(xiàn)象級的表現(xiàn)?如同尬舞機這樣為抖音帶來質(zhì)的變化的功能又有哪些?其中如尬舞機這樣的技術(shù)功能又貢獻幾何?這些功能又有什么特殊之處?
帶著這些問題,我們采訪了抖音產(chǎn)品負責人王曉蔚,以下是采訪內(nèi)容實錄:
? Q:抖音年末的這波爆發(fā)真的是因為新功能“尬舞機”嗎?它是如何做到的,從產(chǎn)品表現(xiàn)來看怎么樣?能詳細介紹一下這個功能嗎?
抖音:其實在封閉開發(fā)的時候我們就有這樣的期待(登頂),畢竟從9月開始抖音就穩(wěn)定在App Store前十。所以開發(fā)的時候項目組的同學都憋著一口氣,想要把這個功能做爆炸,最后也確實實現(xiàn)了。
尬舞機研發(fā)上的技術(shù)支持來自今日頭條人工智能實驗室(簡稱AI lab)。它其實是人體關(guān)鍵點檢測技術(shù)的應用。依靠這項技術(shù),我們能夠檢測到圖像中所包含人體的各個關(guān)鍵點的位置,從而實現(xiàn)從用戶姿態(tài)到目標姿態(tài)的準確匹配。簡單來說是把就把跳舞機、kinect這樣的體感 游戲 搬到了 手機 上。體感類游戲之前受技術(shù)條件的限制,大家只能借助特定硬件設(shè)備才能玩。尬舞機的出現(xiàn)標志著,憑借先進的深度學習技術(shù)的支持,我們已經(jīng)能夠讓我們的手機實時,精準地“讀懂”人體的姿態(tài)和動作,讓普通用戶隨時隨地能夠體驗這種游戲形式。
上午新版本放出以后,就有很多用戶參與進來了。因為尬舞機玩起來沒什么門檻,效果又很“尬”,玩的好的會很酷,玩的不好也會顯得蠢萌蠢萌的,用戶把視頻分享到social渠道不會有什么負擔。事后來看尬舞機視頻的站外分享量都非常高。其實到了當天半夜,我們就已經(jīng) App Store 登頂了,也就不到20個小時吧,那個時候我們原定的推廣活動都還沒開始。
Q: 我們看到近期一些其他產(chǎn)品也推出了類似的功能,從結(jié)果上來看,都沒有尬舞機對抖音的貢獻那么直接明顯,這是否說明產(chǎn)品的增長其實不完全是新功能的作用?
抖音:很多看上去相似的功能,因為工程能力的不同,在實現(xiàn)效果上會有很大差異。以尬舞機為例,動作識別準確率高,用戶才能玩起來,否則只會讓人反感。
而要想做好這個功能,需要解決兩個難題。第一,人體的形變范圍比較大,受衣服變化、物體遮擋等影響嚴重,在日常場景下準確地檢測人體關(guān)鍵點一直是計算機視覺領(lǐng)域中的一個熱點問題。第二個難點是,要實現(xiàn)精準檢測,需要耗費高昂的計算資源,無法在手機端實現(xiàn)日常場景應用。
由于這兩個難點的存在,市面上很多產(chǎn)品的類似功能只能實現(xiàn)半身檢測,甚至人臉檢測。這樣功能的實現(xiàn)效果上會大打折扣,玩法上也會有很多限制。
對此,頭條 AI lab的同事創(chuàng)新了技術(shù)方案。相比于業(yè)界流行的自頂向下(Top-Down)的方案,我們采用的是自底向上(Bottom-Up)的方案。核心是我們針對移動端設(shè)備自研的網(wǎng)絡結(jié)構(gòu),極大地減少計算量,同時讓準確率大幅提升,實現(xiàn)了在移動端的實時無損運行。
? 我們的人體關(guān)鍵點模型是業(yè)界領(lǐng)先的水平 。從實現(xiàn)效果來看, 我們在國內(nèi)首次把檢測范圍擴大到了全身。而對于更簡單,也更廣泛實用化的人臉關(guān)鍵點檢測技術(shù), 可以對視頻進行實時檢測。也積累了很大的人臉庫,可以很準確的識別人臉。
? Q:所以尬舞機是抖音的“大招”嗎?最開始立項要做的原因是什么?
抖音:整個功能前后封閉開發(fā)了一個多月,內(nèi)部確實對尬舞機的效果是有期待的。但不是以憋大招的心態(tài)去做的,像尬舞機這樣玩起來更簡單,效果更酷炫的功能這一年來抖音一直在做。包括背景分割、音樂濾鏡、AR貼紙等等,都是基于我們的AI技術(shù)開發(fā)的特效功能。只不過這次登頂了所以大家都關(guān)注到了。
之所以做這些還是跟我們的初心有關(guān),當初我們做抖音的時候就覺得應該有一個適合中國年輕人的音樂短視頻社區(qū)產(chǎn)品。這個產(chǎn)品要年輕人喜歡玩,能輕松自在表達自己,展現(xiàn)自我,要有意思。所有的功能設(shè)置都是圍繞這個目標展開的,中國年輕人的歌舞基礎(chǔ)很弱,想要更多的人能夠參與表達,就要在產(chǎn)品層面做更好的引導,降低他們表達的門檻,讓他們更容易變酷。
這也是為什么抖音的濾鏡和特效會受到追捧,因為我們確實在這方面投入了很多心血去做好它。說一個挺有意思的事,最近“國民閨女”關(guān)曉彤也開始玩抖音了。看上去她玩的還是挺開心的,最近我們發(fā)現(xiàn)她把個性簽名改成了“這里的濾鏡和美顏讓我無法自拔”,這也算是對我們的特效功能的一種認可吧。
? Q:所以抖音的濾鏡和特效的不同之處是什么呢?
抖音:還是我們的技術(shù)。背后的很多“黑 科技 ”讓我們的特效不僅僅停留于其他平臺的賣萌貼紙。
舉個例子,抖音有一個“實時染發(fā)”的特效,即能在手機上實時改變頭發(fā)顏色,模擬現(xiàn)實生活中的染發(fā)效果。這個功能是站內(nèi)最受歡迎的特效之一,別的平臺還沒有辦法實現(xiàn)。
(實時染發(fā)特效)
其中的難點是頭發(fā)的分割。因為頭發(fā)非常細,邊緣部分的識別和分割非常難。我們專門針對頭發(fā)做了識別優(yōu)化。基于自研的網(wǎng)絡,我們的頭發(fā)分割能達到發(fā)絲級的精度。我們通過頭發(fā)追蹤技術(shù)和自研著色技術(shù),估計頭發(fā)的反射率,能夠在不同的原始發(fā)色和光照條件下渲染大多數(shù)顏色。
? Q:這些“黑科技”對于抖音這一年的增長到底起了哪些作用?
抖音:這么講吧,基本上每次有新玩法新功能出現(xiàn),都能在數(shù)據(jù)上獲得直觀的體現(xiàn)。不僅是尬舞機,“單身狗”、“大臉怪”、“憨厚”等,我們這些在 社交 網(wǎng)絡受到廣泛喜愛的特效,都為我們吸引來了很多新用戶,并形成了很好的品牌效應。
? Q:對于這些新功能新玩法,抖音內(nèi)部有一套運作機制來持續(xù)地開發(fā)嗎?
抖音:談不上什么固定的機制,其實冒出來的想法遠多于最終能夠落地實現(xiàn)的。這些想法一方面來自我們自己產(chǎn)品運營同學的腦洞,另一方面,我們也會從用戶那里汲取靈感,有些想法是用戶直接反饋給我們,有些則是我們從用戶的視頻里發(fā)現(xiàn),通過技術(shù)手段來實現(xiàn)。
前不久,今日頭條與北京大學共同完成的“互聯(lián)網(wǎng)信息摘要與機器寫稿關(guān)鍵技術(shù)及應用”項目獲得了吳文俊人工智能技術(shù)發(fā)明獎。吳文俊獎被外界譽為“中國智能科學科技最高獎”。
背后有頭條 AI lab 的支持,也是抖音比較幸運的地方,這讓我們的很多想法有機會落地。這可能也是我們相對于其他同類產(chǎn)品的優(yōu)勢。反過來包括抖音在內(nèi)頭條的眾多產(chǎn)品業(yè)務線,為lab前沿的AI技術(shù)研究提供了應用的場景。