社交網絡+大數據真的用來可以模擬一個活人嗎?
作者:筆戈科技 肥肥貓
最近在B站惡補了一部幾年前的英劇。《黑鏡》(Black Mirror)。
這片子風格奇特,每一集都獨立成篇,講一個完全架空的故事。其題材天馬行空無跡可循,所以我一直是拿它當英國版的《世界奇妙物語》來看的。
其中第二季第一集讓我腦洞大開:
故事說的是一對彼此深愛的夫妻,某日丈夫出門后就再無音訊,直到警察上門妻子才道丈夫出車禍死了。原本甜蜜平靜的日子突遭飛來橫禍,妻子痛不欲生。
在葬禮上,妻子的閨蜜偷偷告訴她,為了幫助她度過這段感情上最艱難的時期,已經為她注冊了一個新的互聯網虛擬服務。這個服務可以自動搜尋死者生前在互聯網上的一切蹤跡,最后以人工智能的形式產生一個虛擬AI,來模仿死者生前的思維和說法風格。而她的丈夫生前是各個社交網絡的重度使用者,存在網上的信息極多,是最適合這款服務的。
妻子抱著將信將疑的態度,點擊接受了來自“丈夫”的一封電子郵件,并和這個虛擬的丈夫聊了起來。神奇的是,這個AI說的話真的和自己原來的丈夫一模一樣。妻子最終沉迷其中,將這個機器人當成了感情寄托。
這個橋段,如果我沒記錯,在有《黑鏡》之前我就見過有人設想過。
當時我就覺得在商業上和技術上是有可行性的。就僅僅只是日常使用,在不知不覺中,我們留在互聯網上的蹤跡是海量的。
我10年前用QQ,到了2006年左右換成了MSN,當時MSN的聊天記錄是可以任意導出保存的。我清楚的記得,大概一年不到的時間,我的聊天記錄就積累了大概十幾萬字,如果打印出來,那就是一本書。
2006年后,中國的互聯網一日千里。msn是很快就沒人再用了,之后從飛信,到開心網、人人、微博,直到微信橫空出世,每一個都留下了我的足跡。更不用說我還在博客、知乎、豆瓣、天涯這些深度交流平臺留下了數以萬字的各種記錄。如果把我這10年來所有面向互聯網端輸出的內容集結起來成冊,我估計堆滿一層書架是絕對沒有問題的。
10年如此,20年呢?50年呢?到我離開人世的時候,我向互聯網段輸出的文字、語音、圖片、視頻那得有多少?這還只是聯機部分,在我的本地硬盤里,還有著十幾個G的照片和我保存的各種文檔。這些一旦全部用來模擬我的語氣、行文、甚至思考角度思考方式,綽綽有余。
《黑鏡》里也強調了這一點,AI向女主角建議,除了丈夫生前po在twitter、google+、iCloud、facebook、ins上的東西外,如果授權它訪問本地email和硬盤,AI就會掌握更多素材,也就越學越像。
到最后,思念亡夫心切的女主角把所有丈夫生前的視頻都發給AI,讓AI提取音軌,AI在海量的音頻分析提取后,學會了用死者的聲音給女主角打電話。每天和“丈夫”幸福地煲電話粥的女主已經徹底接受了AI的陪伴。
這種模擬聲音的形式其實現在“民間”也有,A站B站的鬼畜調教其實就是。只是這些up主的素材(王司徒之類)非常有限,一個個字得去調試又太花時間。不過可以想象,這些在未來技術更加進步之后都將不再是問題,甚至自動解決。
如果影片就此結束,倒也不失為一部溫情的,憧憬未來科技的好片子。不過,顯然作者想說的東西更多:
女主角在習慣了語音和文字的陪伴后,被AI安利了極為昂貴的專業級服務方案。
在使用了精準的3D打印服務。在妻子提供了了幾千張丈夫的照片后,服務商提取出了丈夫的臉部輪廓的外形數據,并做出了一個近似充氣娃娃的硅膠機器人實體(這是全片最接近現實科技水平的地方)
這個機器人甚至還可以和女主角過上夫妻生活。
實體模擬+語音模擬+大數據抓取+人工智能,這本來應該是個完美的搭配。
但作者在此處畫鋒漸變,妻子在和“丈夫”的相處中,逐漸出現了越來越多的問題。
而這些問題,我也早已料到了:
丈夫作為社交網絡重度用戶,他的“展示面”是不真實的。
我們呈現出的,發在朋友圈的,微博上曬的,群里說的話,貼的圖,都只是“我們想呈現給別人的自己”而已。用知乎菠菜姐的話來說,“我們扮演的,只是我們自己的形象大使”。
而AI和服務商僅僅以一個人在社交網絡上的“展示面”為素材,在模擬人性、人心上,就會出現致命的偏差。而這種差異,對于死者久未謀面、狐朋狗友來說或許體察不到。但作為朝夕相對的妻子,馬上就能敏銳的感受到這種不真實。她能感受的到的,只是AI機器人無時無刻不在炫耀,吹噓自己,甚至編造出虛假的記憶,說著自以為是的俏皮話,而這,和她真正的枕邊人有著本質的區別。
我腦補了一下,如果把身邊大部分人用他們的朋友圈和微博大數據模擬一下,大概都是那種只吃高檔餐館,只去海外旅游,50%的時間在給各種菜肴拍照,認識的人全是名流的那種,或者要么是那種每天都有情傷待療的抑郁癥型人格吧。如果再把它們的知乎數據也導入,那光是想象一下他們掛在嘴邊的口頭禪,大概就足以把我逼瘋了。
影片的最后,心碎的女主角最終把機器人放在了閣樓吃灰,雖然她依然舍不得扔掉這位替代品,但終于接受了斯人已去的現實。
而觀眾應該也領悟到了:
對于所謂的,用歷史數據和“大數據”編制的智能神話,距離模擬活人,我們還離得很遠。
End.