酷狗持續探索AI音樂領域 行業首創AI合成粵語歌
“我越有點東西”。看到楊超越成為首位明星AI歌手后,有用戶在微博上發文夸好聽。
用戶夸的是“超越AI”唱的一首粵語歌《漫步人生路》,AI學習和還原了楊超越的音頻特征,再用她的聲音唱出這首粵語歌曲。目前,這種模擬人聲的AI技術已經明顯脫離了“機械感”,仿佛真人在歌唱。
“超越AI”發布者酷狗音樂稱,未來還會有更多風格各異、特色突出的AI歌手陸續上線,這些AI歌手將集中在“超級訂閱”頻道。這是酷狗在AI落地方面的一次最新嘗試,“超越AI”的上線,是希望借助明星的影響力,讓”AI歌手”這一功能為更多人群知曉和喜愛,也讓一些小眾歌曲破圈,讓好音樂得到更多關注。同時也希望能為音樂行業帶來更多的想象空間,讓AI技術真正落地服務于音樂人、滿足音樂用戶的需求。
AI歌手背后的黑 科技
作為《創造101》最出圈的明星,大部分人對楊超越的第一印象是,她因為學不會唱跳,在節目中嚎啕大哭。
但現在,“超越AI”可以輕松學會一首歌,并用不遜色專業歌手的能力唱出來,甚至包括粵語歌。
這背后是酷狗阿波羅聲音實驗室多年來的潛心研發。據站內官方資料顯示,阿波羅聲音實驗室,是酷狗音樂旗下負責聲音科技、智能音樂技術研發的先鋒團隊,在聲音合成、聲音復刻、音樂識別、音樂內容理解等技術領域具有眾多首創研究和深厚積累。實驗室研發了一系列創新的技術,如個性化聲音合成、音頻指紋、翻唱識別、音軌分離等,開發了酷狗歌嘰歌嘰、聽歌識曲、多音軌播放等眾多產品功能,致力于為用戶帶來更好的音樂娛樂體驗。
酷狗技術負責人介紹,“超越AI”所演唱的歌曲,是通過自主研發的阿波羅聲音引擎合成,該技術采用深度神經網絡模型,能夠高度還原和復刻音頻特點,合成逼真、且富有表現力的歌聲,而粵語歌聲的合成技術,則是行業首個。“我們自研了一套粵語的合成系統,將粵語、國語混合建模,只需要提供國語的錄音數據,就能合成粵語歌。”
歌聲不同于平常的語音,高低音轉換、唱歌風格、多個語種等有著更復雜的模式,所以AI音樂是一個算法和藝術的交叉領域,需要解決機器不擅長學習的個性化和審美傾向,就要靈活采用多種技術手段。酷狗的AI歌手在這個領域進行了嘗試,并已經落地。比如“超越AI”的歌曲列表中,有一首周筆暢原唱的《最美的期待》,這首歌需要扎實的演唱技巧來表現感情。通過AI技術,可以用楊超越的聲音疊加原唱周筆暢的演唱功底,副歌部分甚至采用了真假音轉換,展現出高音甜、中音準、低音穩的特色。
據了解,超越AI涵蓋了“歌聲聲紋提取”、“多語種的歌聲合成”、“多情感語音合成的聲學模型”等多個先進技術,并申請了11件發明專利。酷狗技術負責人表示,目前他們正在主攻虛擬歌手唱歌、調教研發,積極探索AI技術的多個應用場景,如明星AI歌手、用戶自建AI歌手等。
目前,“超越AI”可以演繹超過20首熱門單曲,包括《體面》、《白月光與朱砂痣》等不同曲風的國語歌,還有《漫步人生路》《春嬌與志明》等粵語歌,曲庫列表正在每月上新中。
酷狗持續發力創新
進入2022年, 互聯網 大廠紛紛在研發上加大投入,音樂行業也是如此。根據酷狗音樂所在的騰訊音樂集團財報,2021年全年,騰訊音樂集團為了擴大產品與技術創新方面的競爭優勢而大幅度增加了研發投入。
近年來,酷狗也在音樂研發與創新上多次嘗試。去年10月,酷狗圍繞“曲譜荒”的問題上線了“一鍵求譜”功能,并應用了AI曲譜技術,音樂愛好者可以針對性地搜羅曲譜,也可以自主上傳曲譜,上線以來已經有超過百萬的用戶求譜交流。
去年年底上線的酷狗蝰蛇音效·多音軌功能,是國內首個能同時實現歌曲智能分軌、多軌播放,并對不同音軌增加3D空間聽感的功能。作為音頻領域的一大創新,酷狗蝰蛇音效·多音軌功能在聽覺上賦予音樂空間感、方向感,能讓聲音在三維空間中精準的環繞于聽眾的耳朵,還能實現把任意音樂中的人聲、多種樂器聲等不同音色的音軌剝離或單獨控制播放。
另外,酷狗也推出了“歌嘰歌嘰”產品,集合了“詞、曲、編、唱”于一體的“原創”功能,通過AI輔助作曲、作詞,音樂小白也能創作出歌。
當下,在線音樂行業已經從快速增長變為存量競爭,但仍持續擴大。艾媒咨詢數據顯示,2021年中國數字音樂市場規模達到428.9億元,同比增長20.03%,預計2022年達到482.7億元。其中,艾媒咨詢分析師認為,在技術推動的作用下,中國數字音樂市場規模不斷擴大。
此次上線AI歌手,酷狗音樂相關負責人稱,將AI語音與音樂產業的諸多結合應用,能為業內帶來更多的想象空間,讓AI技術真正服務于廣大音樂人、音樂用戶,讓技術真正推動產業發展,酷狗也將在技術領域持續投入。