打破語(yǔ)言壁壘,百度翻譯同傳為智源大會(huì)構(gòu)建跨國(guó)溝通橋梁
6月21日至24日,2020北京智源大會(huì)盛大開(kāi)幕,五位圖靈獎(jiǎng)得主、十多位院士、一百多位專(zhuān)家學(xué)者齊聚一堂,共同探討人工智能的下一個(gè)十年。受疫情影響,本屆大會(huì)以在線直播的形式舉行,吸引了全球?qū)W術(shù)界、產(chǎn)業(yè)界超過(guò)2.5萬(wàn)人報(bào)名參會(huì)。為了更好的幫助國(guó)內(nèi)外觀眾理解報(bào)告內(nèi)容,百度翻譯為本次大會(huì)提供了機(jī)器同傳服務(wù)。
百度翻譯同傳現(xiàn)場(chǎng)效果展示
人工同傳專(zhuān)業(yè)性強(qiáng),難度極高
同傳是一項(xiàng)專(zhuān)業(yè)性極強(qiáng)、難度極大、耗腦又耗嗓的工作。除了深厚的語(yǔ)言能力外,還需要極強(qiáng)的反應(yīng)能力,邊說(shuō)邊聽(tīng),精力高度集中,對(duì)譯員的腦力和體力都是極高的挑戰(zhàn)。因此往往一場(chǎng)會(huì)需要兩個(gè)甚至多個(gè)譯員共同完成同傳。
國(guó)際會(huì)議口譯員協(xié)會(huì)(International Association of Conference Interpreters,簡(jiǎn)稱(chēng)AIIC)作為會(huì)議口譯職業(yè)全球唯一專(zhuān)業(yè)協(xié)會(huì),全球會(huì)員僅有約3000人,其中漢語(yǔ)普通話(huà)會(huì)員僅50人。而據(jù)不完全統(tǒng)計(jì),僅中國(guó)每年需要同傳的國(guó)際會(huì)議就有上萬(wàn)場(chǎng)。巨大的市場(chǎng)需求與譯員的稀缺形成強(qiáng)烈反差。
機(jī)器同傳成研究熱點(diǎn),百度翻譯提出多項(xiàng)創(chuàng)新
近年來(lái),得益于人工智能技術(shù)的綜合進(jìn)步,結(jié)合語(yǔ)音技術(shù)和機(jī)器翻譯技術(shù)的機(jī)器同聲傳譯成為國(guó)際前沿研究的熱點(diǎn)。機(jī)器同傳面臨一系列國(guó)際公認(rèn)的難題,如語(yǔ)音識(shí)別錯(cuò)誤傳遞、翻譯質(zhì)量與時(shí)間延遲難以平衡等。
針對(duì)這些難題,百度翻譯團(tuán)隊(duì)展開(kāi)攻關(guān),先后提出了集成預(yù)測(cè)與可控時(shí)延的翻譯模型、語(yǔ)義單元驅(qū)動(dòng)的上下文感知翻譯模型、融合音節(jié)與文本的聯(lián)合編碼模型、基于知識(shí)蒸餾的端到端同傳模型、語(yǔ)音識(shí)別與翻譯交互解碼等一系列創(chuàng)新技術(shù),在語(yǔ)音容錯(cuò)、平衡質(zhì)量與時(shí)延、語(yǔ)篇翻譯連貫性和端到端同傳模型等方面取得突破,研發(fā)了高質(zhì)量、低時(shí)延的機(jī)器同傳系統(tǒng)。在2018《麻省理工 科技 評(píng)論》十大技術(shù)突破中,百度被列為語(yǔ)音翻譯領(lǐng)域“Key Player”,成為國(guó)內(nèi)唯一上榜單位。
遠(yuǎn)程直播會(huì)議新形式,百度同傳研發(fā)新方案
全球疫情使得大量會(huì)議改為了線上進(jìn)行。此次智源大會(huì)采取演講人遠(yuǎn)程接入,觀眾通過(guò)直播平臺(tái)觀看的形式舉行。這種形式進(jìn)一步加重了同傳的難度:
一是語(yǔ)音識(shí)別難度增大。為了適應(yīng)網(wǎng)絡(luò)帶寬,在線會(huì)議軟件對(duì)聲音信號(hào)進(jìn)行壓縮編碼處理,同時(shí)傳輸過(guò)程中易受多種信號(hào)干擾,原始聲音信號(hào)不穩(wěn)定,對(duì)語(yǔ)音識(shí)別挑戰(zhàn)極大。
二是多場(chǎng)會(huì)議并行,對(duì)系統(tǒng)穩(wěn)定性要求高。以往的會(huì)議往往都是一場(chǎng)會(huì)議發(fā)言人順序進(jìn)行,而本次會(huì)議共有19個(gè)分論壇,最多的時(shí)候同時(shí)并行6場(chǎng),系統(tǒng)部署難度超過(guò)以往。
三是領(lǐng)域龐雜,專(zhuān)業(yè)性強(qiáng)。本次大會(huì)涵蓋智能體系架構(gòu)、智能芯片、認(rèn)知神經(jīng)、機(jī)器感知、人工智能倫理、AI醫(yī)療、AI交通等多個(gè)領(lǐng)域,每一個(gè)領(lǐng)域都極具專(zhuān)業(yè)性,專(zhuān)業(yè)術(shù)語(yǔ)和領(lǐng)域知識(shí)翻譯難度大。
針對(duì)以上難題,百度研發(fā)了創(chuàng)新的機(jī)器同傳解決方案。搭載百度語(yǔ)音自研的SMLTA聲學(xué)建模技術(shù),并通過(guò)對(duì)音頻信號(hào)的加強(qiáng)處理,提升了識(shí)別的魯棒性;采用云端在線部署,極大降低了部署難度和成本,可根據(jù)需求迅速擴(kuò)容,高效滿(mǎn)足不同形式的同傳需求;通過(guò)遷移學(xué)習(xí)、預(yù)訓(xùn)練加精細(xì)化訓(xùn)練等技術(shù),可以迅速提升領(lǐng)域模型的翻譯效果,滿(mǎn)足多領(lǐng)域翻譯需求。
新機(jī)遇新挑戰(zhàn)促發(fā)展
目前,機(jī)器同傳已在許多國(guó)際會(huì)議上嶄露頭角,它的優(yōu)勢(shì)在于可以借助強(qiáng)大的AI技術(shù)和數(shù)據(jù)庫(kù)作為后盾,掌握并調(diào)取更多資料和專(zhuān)業(yè)領(lǐng)域的知識(shí),持續(xù)工作,不知疲倦。
同時(shí),也需要清醒的認(rèn)識(shí)到,機(jī)器同傳仍面臨多項(xiàng)國(guó)際公認(rèn)難題,如語(yǔ)音容錯(cuò)、數(shù)據(jù)稀缺、評(píng)價(jià)困難等,需要多學(xué)科、多技術(shù)深入交叉融合,共同進(jìn)步。基于此,在今年即將召開(kāi)的領(lǐng)域頂級(jí)會(huì)議ACL上,百度聯(lián)合谷歌、臉書(shū)、賓夕法尼亞大學(xué)、清華大學(xué)等國(guó)內(nèi)外著名公司和高校,舉辦首屆機(jī)器同傳研討會(huì),邀請(qǐng)了多名人類(lèi)同傳專(zhuān)家、機(jī)器翻譯專(zhuān)家共同探討機(jī)器同傳技術(shù)進(jìn)展、面臨挑戰(zhàn)及未來(lái)發(fā)展。
未來(lái),百度將持續(xù)進(jìn)行技術(shù)創(chuàng)新,推動(dòng)機(jī)器同傳技術(shù)邁向新的階段,構(gòu)筑跨語(yǔ)言溝通橋梁,促進(jìn)全球協(xié)作。