世界人工智能大會在滬舉辦:騰訊QQ黃俊洪分享社交產品AI新玩法
2020年7月9日-10日,第三屆“世界人工智能大會云端峰會”在上海舉辦,今年騰訊論壇給出的與會主題是“綻放視界想象力”。此次云端峰會匯聚全球人工智能領域的專家學者、業界精英、 科技 工作者等有識之士,騰訊論壇更是邀請國內外數十位重量級嘉賓,帶來5場主題演講和1場圓桌論壇,進行觀點與經驗的交流,思想與智慧的碰撞,探討人工智能的應用與未來。
在騰訊專場論壇上,PCG平臺與內容事業群 社交 基礎技術部總經理、騰訊QQ技術負責人黃俊洪受邀出席,介紹了QQ光影研究室在CV領域的研究成果及影像技術體系,包括美顏領域GAN網絡,體態、手勢識別技術,AI人臉融合、富文本語義聯想、語音合成等技術和創新玩法在社交領域的落地案例,同時分享創新領域未來所面臨的挑戰和技術展望。
QQ構建全面CV技術體系,支撐多場景多產品線玩法落地
“十年AI科技的發展,我們可以看到AI的應用無處不在,醫療,工業,安防,自動駕駛,量化交易,乃至我們常用的 手機 APP,都能看到AI的身影”,黃俊洪在演講中指出AI科技的魅力無處不在。而隨著AI算法模型能力的不斷提升,也依靠算力的增長,越來越多新的AI能力已經達到落地的效果以及性能要求,并可逐步應用于我們的日常生活產品中,而社交AI能力的持續發展也將使社交產品的玩法變得更加豐富多彩。
黃俊洪表示:QQ團隊在CV方面建設了全面的技術體系,構建發布器中臺,實現對AI能力業務落地的支持。從檢測追蹤分割等傳統任務,到基于GAN的人臉屬性、風格遷移,到基于3DMM和自研引擎的Animoji和3D掛件及美妝,再到基于slam的AR技術,都有所儲備和布局,在最上層和業務場景有著廣泛的結合與落地。
比如基于3D人臉重建+GAN的技術,第一次讓用戶可以實時編輯自己的年齡。黃俊洪介紹:“在年齡變換的運營活動中,有用戶留言說,和家里的老人用了這個功能,看到了家里老人年輕的樣子,很感動,很多人以前沒有拍照條件,通過AI技術解決了這個遺憾?!背酥?,基于GAN網絡可以迅速完成各式各樣不同風格的卡通畫生成,滿足不同用戶的訴求;基于人體遷移網絡,讓用戶只需上傳一張照片就變身靈魂的舞者。
除了滿足終端用戶的需求,QQ團隊的AI能力以拍攝發布器中臺為載體,服務了騰訊公司內部多路產品線,為包括QQ,微視,QQ空間,騰訊視頻,Now直播,王者榮耀,QQ音樂、全民K歌等業務提供實時美顏、AR掛件、視頻編輯等能力,并通過騰訊云為合作伙伴提供業務支撐。
AI技術仍在高速演進,面對挑戰必須踐行科技向善
黃俊洪介紹:隨著AI技術的推進,使我們對2D圖像視頻的理解和編輯具備了更大的靈活度和自由度,未來大家會看到更加真實的GAN技術生成的圖像和視頻 ,一個不存在的場景或者角色都可能栩栩如生的出現在一張圖片或者一個視頻中。除了2D圖像視頻領域,基于AI的3D重建和神經網絡渲染,在未來也會迎來更大的應用,比如用戶可以用非常簡單的方式創建自己的虛擬形象。
甚至在語音定制技術方面,QQ團隊也在嘗試通過積累數萬個中文發音人數據去訓練一個用戶音色向量提取網絡模型,再應用多人的高質量語音數據遷移學習到文本到個人音色的映射關系,合成個性化的聲音。而這個技術未來也可能應用在一些公益性的場景,比如留守兒童的伴讀等等。
黃俊洪表示:更便捷,更真實,更實時的技術必然讓我們在面對偽造數據時面臨挑戰,AI服務也大量需要GPU資源,這對我們后續服務架構也提出了新的要求,AI服務的邊界和倫理道德問題同樣是一個需要被關注的問題。只要善用技術,科技向善,我們就一定能夠克服新AI技術帶來的挑戰,為用戶創造更多價值。