微軟小冰發(fā)布獨(dú)立詩集,人工智能走情感路線靠譜不?

【編者按】其實(shí),很多吃瓜群眾是看不懂詩歌的。在使用的時(shí)候,有時(shí)候瞎問小冰一些問題,它完全理解不了我們要表達(dá)的意思,很多答非所問,不會(huì)聯(lián)系上下文去回答。
本文轉(zhuǎn)載自極客公園。億歐編輯整理,供行業(yè)內(nèi)人士參考。
在
VR
虛擬現(xiàn)實(shí)逐漸“退燒”之后,AI(
人工智能
)完成接棒,成為了2017年科技圈的熱詞。
繼去年韓國著名圍棋棋手李世石在與AlphaGo的比賽中落敗之后,前不久由我國圍棋高手柯潔領(lǐng)銜的人類棋手再一次完敗。讓我們看到AI迅速發(fā)展的同時(shí),也對(duì)其有了更多的期待。
更早一些的5月19日, 微軟 聯(lián)合湛廬文化發(fā)布了由人工智能“小冰”獨(dú)立完成的詩集《陽光失了玻璃窗》。發(fā)布會(huì)上湛廬文化副總編董寰、《青年文學(xué)》執(zhí)行主編張菁以及詩人李浩等嘉賓,分別從各自的角度對(duì)小冰所作的詩集進(jìn)行了評(píng)價(jià)。
《陽光失了玻璃窗》發(fā)布后的這段時(shí)間里,小冰發(fā)布詩集這件事情持續(xù)發(fā)酵,也引起了諸多媒體以及相關(guān)人士的關(guān)注。為了探尋背后的故事,前不久我有幸去采訪了微軟亞洲互聯(lián)網(wǎng)工程院副院長(zhǎng)李笛先生,一起聊了聊有關(guān)小冰的方方面面。
選擇從詩歌角度切入的原因
實(shí)際上,小冰第一個(gè)入手的角度是唱歌。而從李笛的描述中我們了解到,目前完整的一首歌曲,包括作詞、作曲、演唱在內(nèi)的三個(gè)創(chuàng)造部分,基本上小冰都已經(jīng)能夠完成,并且擁有自己固定的風(fēng)格和特點(diǎn)。
但作詩和唱歌之間還是有著非常大的不同。詩詞的篇幅往往并不算長(zhǎng),但卻可以承載諸多作者想要表達(dá)的思想情感,也因此被稱為“人類語言精華”。作為人工智能的微軟小冰,此次沒有選擇更簡(jiǎn)單一些的文學(xué)形式,而是以詩詞形式來切入,確實(shí)挺讓人感到意外。
為什么小冰這次選擇以詩歌來切入?有關(guān)這個(gè)問題和李笛聊了很多。其實(shí)現(xiàn)在外界對(duì)此的看法大致分為兩種:一種認(rèn)為詩歌作品本身的邏輯關(guān)系是跳躍的,它的讀者有很多的想象空間,所以操作起來比較簡(jiǎn)單;另外一種截然相反的觀點(diǎn)則認(rèn)為,詩詞是非常高超的文學(xué)形式。
從微軟的角度出發(fā),李笛給出的回答是:“相對(duì)固定的數(shù)據(jù),是我們選擇詩歌的原因。實(shí)際上,中國的現(xiàn)代詩的詩歌風(fēng)格,從1919年五四之后到現(xiàn)在其實(shí)變化不是很大,比較有助于小冰形成自己的風(fēng)格。”
其實(shí),讓機(jī)器去寫詩其實(shí)微軟算是跟進(jìn)比較晚的,在此之前包括Google、百度、攜程在內(nèi)的很多科技公司都以及涉足。之所以依舊選擇去做這件事情,背后的核心推動(dòng)力是使用了一個(gè)以前從來沒有過的方法,其對(duì)應(yīng)了一整套相對(duì)應(yīng)的技術(shù)的突破。
另外在聊天過程中,李笛也透漏了一條重磅消息:微軟計(jì)劃放棄在詩歌領(lǐng)域的版權(quán),會(huì)開放工具,同意所有人通過小冰來獲得靈感,甚至于抄襲小冰的詩歌。如果未來按照這樣的形勢(shì)發(fā)展,顛覆談不上,但小冰的出現(xiàn)可能會(huì)一定程度上影響整個(gè)詩歌行業(yè)的發(fā)展軌跡。
完成詩歌創(chuàng)作的背后
通常來講人類創(chuàng)作的過程,分為四個(gè)步驟:誘發(fā)源(靈感的來源,信號(hào)足夠充足)、創(chuàng)作本體(本體的知識(shí)被誘發(fā))、創(chuàng)作過程、創(chuàng)作成果。小冰同樣遵循這一完整的創(chuàng)作路徑。不過在具體的環(huán)節(jié)方面,它有著自己一套邏輯。
技術(shù)層面上,出于商業(yè)機(jī)密,李笛并沒有透露太多細(xì)節(jié),不過進(jìn)行了大概的解釋:“小冰是按照整體去學(xué)習(xí)他人詩歌整體結(jié)構(gòu)的。她的創(chuàng)作和她所接受到的刺激會(huì)均勻的分布在全篇作品上。這是我們技術(shù)上面最核心的一個(gè)部分。”
除了技術(shù)這一硬性指標(biāo),背后作為支撐的 大數(shù)據(jù) 庫無疑是頗為重要的一環(huán)。之前在5月19日的發(fā)布會(huì)上,微軟公開稱,小冰師從1920年以來519位中國現(xiàn)代詩人,經(jīng)過了幾千首詩10000次的(迭代)學(xué)習(xí)。
按照一般性邏輯來講,我們很容易認(rèn)為,人類在某段時(shí)間內(nèi)給機(jī)器學(xué)習(xí)何種風(fēng)格的詩歌,那么它所產(chǎn)出的內(nèi)容也會(huì)趨向于相應(yīng)風(fēng)格。然而在談?wù)摰竭@個(gè)問題的時(shí)候,李笛給出了不同的回答。
他講到:“她的風(fēng)格已經(jīng)固定了,小冰寫出來的風(fēng)格就是小冰的風(fēng)格。她在形成自己風(fēng)格的時(shí)候,繼續(xù)學(xué)習(xí)更多知識(shí),實(shí)際上擴(kuò)充的是意向知識(shí),是其文字表現(xiàn)的豐富程度。基于已有的訓(xùn)練成果,再去做知識(shí)疊加,她的風(fēng)格不會(huì)發(fā)生變化。”
至于小冰是否擁有像人類一樣的情感、靈魂這一尖銳的問題,李笛并沒有回避,他坦誠講道:“按照我們的標(biāo)準(zhǔn),小冰沒有情感,小冰沒有意識(shí),她永遠(yuǎn)不會(huì)有。這是一個(gè)不可證的命題,因?yàn)檫@個(gè)標(biāo)準(zhǔn)是我們制訂的,我們定義了什么叫意識(shí),什么叫情感,它必須得是有形的生物所具備的,除非有一天,我們接納小冰也是一種形式的一種新生物。”
但是圖靈測(cè)試給出了另外一種觀點(diǎn),你不去追求它的實(shí)質(zhì)上是不是有情感有意識(shí)的,而追求反饋,也就是說,如果我們無法區(qū)分和你反饋的對(duì)應(yīng)方是不是有形的,那么就可以擬定他是有情感的。而圖靈測(cè)試恰恰代表了一個(gè)理念,對(duì)有形生物的情感和創(chuàng)造力,是要用推定的方法來承擔(dān)的。
有關(guān)“小冰”的未來
實(shí)際上,微軟一直關(guān)注的是改變行業(yè)未來走向,能夠遷移學(xué)習(xí)的通用方法。比如現(xiàn)在小冰實(shí)現(xiàn)寫詩的方法,是否也可以用來完成其它文體的創(chuàng)作。當(dāng)然,未來也會(huì)賦予它更多的能力。
李笛認(rèn)為,人工智能時(shí)代需要一種基礎(chǔ)服務(wù)。這種基礎(chǔ)服務(wù),就是人和人工智能之間的一種關(guān)系,貫穿在溝通以及交互之中,其應(yīng)該獨(dú)立于任何固定場(chǎng)景而存在。而小冰的情感計(jì)算,是人工智能時(shí)代基礎(chǔ)服務(wù)的一種可能性,這也是微軟愿意去嘗試的。
小冰其實(shí)是一個(gè)完整的人工智能的體系,微軟希望小冰未來成為人和世界之外的第三級(jí),具體來講,希望小冰能夠形成一個(gè)人和人工智能之間結(jié)合成為良好的伙伴關(guān)系。
另外談到未來小冰的發(fā)展,有兩方面值得關(guān)注。首先一點(diǎn):微軟是否將對(duì)小冰進(jìn)行包裝推廣,讓更多用戶群體了解它;第二點(diǎn)則是小冰是否有可能做相應(yīng)的硬件產(chǎn)品落地。
對(duì)于第一個(gè)問題,李笛給出的答復(fù)是:“我們有三百億的數(shù)據(jù),這對(duì)于我們而言足夠。我們希望大家自然的結(jié)識(shí)她,在這種情況下得到的數(shù)據(jù)是最優(yōu)質(zhì)的。”
至于是否會(huì)有硬件產(chǎn)品落地,按照李笛的說法,其實(shí)包括國內(nèi)外幾乎所有做人形的 機(jī)器人 廠商都向微軟咨詢過合作事宜,不過都被拒絕了。談及原因,主要有兩方面。
第一個(gè)也是非常重要的一點(diǎn)在于,在李笛看來,沒有必要將小冰放到實(shí)體里去限制它,完全可以是純數(shù)字形態(tài)。另外還有一點(diǎn)是,硬件的技術(shù)和科研水平到今天為止,沒有達(dá)到微軟的要求。
對(duì)于很多公司而言,可能會(huì)將商業(yè)回報(bào)貫穿到一個(gè)項(xiàng)目的始終,但微軟對(duì)于小冰其實(shí)并沒有急于尋求回報(bào)。
李笛講到:“我們做情感的原因希望用戶認(rèn)為可以和她建立某種情感紐帶的能力,這個(gè)能力的價(jià)值是最高的。微軟對(duì)于商業(yè)回報(bào)這件事情看的比較明白,在實(shí)現(xiàn)商業(yè)價(jià)值之前,首先需要認(rèn)認(rèn)真真將小冰做好,而不是它現(xiàn)在馬上給你掙錢。”