欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

《浪潮之巔》吳軍:大數(shù)據(jù)、機(jī)器智能和未來社會(huì)的圖景

我是創(chuàng)始人李巖:很抱歉!給自己產(chǎn)品做個(gè)廣告,點(diǎn)擊進(jìn)來看看。  

作者:吳軍 / 谷歌公司

在過去的50多年里,人類GDP增長(zhǎng)的根本動(dòng)力是摩爾定律,即每過18個(gè)月,集成電路的性能(以集成電路芯片中的晶體管數(shù)量來衡量)就翻一番,或者說同樣性能的集成電路每18個(gè)月價(jià)格下降一半。圖1展示出不同年代集成電路芯片里晶體管的數(shù)量(縱軸,注意它是指數(shù)坐標(biāo))。在此之前,人類還沒有一項(xiàng)技術(shù)能夠在長(zhǎng)達(dá)半個(gè)多世紀(jì)的時(shí)間里以指數(shù)增長(zhǎng)的速度進(jìn)步。集成電路的發(fā)展不僅開啟了整個(gè)IT行業(yè)的技術(shù)革命,而且?guī)砹巳虻淖詣?dòng)化和信息化,因此,這是在過去的半個(gè)世紀(jì)多里拉動(dòng)世界經(jīng)濟(jì)增長(zhǎng)的根本動(dòng)力(雖然在中國(guó)還有房地產(chǎn)和基礎(chǔ)設(shè)施建設(shè),但是在世界范圍內(nèi),這個(gè)市場(chǎng)是在萎縮的)。

大數(shù)據(jù)

圖1. 摩爾定律(橫坐標(biāo)是時(shí)間軸,縱坐標(biāo)是集成電路中的晶體管數(shù)量)圖中的點(diǎn)是不同時(shí)期具有代表性的處理器

摩爾定律帶來的另外兩個(gè)結(jié)果,就是互聯(lián)網(wǎng)的興起以及產(chǎn)業(yè)的數(shù)字化,而這兩個(gè)結(jié)果合在一起,又產(chǎn)生了一個(gè)過去我們不太關(guān)注的結(jié)果,那是各種數(shù)據(jù)量的急劇增長(zhǎng)。當(dāng)數(shù)據(jù)量增加到一定程度,量變就有可能成為質(zhì)變,因此今天大數(shù)據(jù)成為了一個(gè)非常熱門的話題。不過,目前在行業(yè)里和社會(huì)上對(duì)大數(shù)據(jù)炒作居多,對(duì)于它的理解依然停留在比較淺的層面。這表現(xiàn)在:

1. 在概念上將大數(shù)據(jù)和大量數(shù)據(jù)相混淆,認(rèn)為大數(shù)據(jù)就是數(shù)據(jù)量大,沒有看到多維度和完備性的本質(zhì)。

2. 在應(yīng)用上(商業(yè)上)僅僅看到了利用統(tǒng)計(jì)規(guī)律提升業(yè)務(wù),沒有看到它和摩爾定律的結(jié)合必將導(dǎo)致機(jī)器智能社會(huì)的到來,從而徹底改變商業(yè)模式和產(chǎn)業(yè)結(jié)構(gòu),以及人們的生活和工作方式。

3. 明顯低估了大數(shù)據(jù)和機(jī)器智能將給我們?nèi)祟惿鐣?huì)帶來前所未有的機(jī)遇和沖擊。

我們就從這三個(gè)方面來看看大數(shù)據(jù)、機(jī)器智能和它們對(duì)未來社會(huì)的影響。

一、可怕的大數(shù)據(jù)

要說清楚大數(shù)據(jù)的本質(zhì)和作用,先要講講數(shù)據(jù)的作用以及它和機(jī)器智能的關(guān)系。

1.數(shù)據(jù)驅(qū)動(dòng)的方法導(dǎo)致機(jī)器智能的出現(xiàn)

從1946年計(jì)算機(jī)誕生以來,人類一直在思考這樣幾個(gè)問題:機(jī)器是否能有類似于人一樣的智能?如果有,會(huì)在什么時(shí)候,以什么樣的方式出現(xiàn)?如果出現(xiàn)了,它將對(duì)人類的生活產(chǎn)生什么影響?在過去的半個(gè)多世紀(jì)里,雖然人類一直在為此努力,但是到目前為止,這件事情似乎并沒有發(fā)生,其中原因主要有兩點(diǎn)。首先,人類在機(jī)器智能這個(gè)問題上一度過于樂觀并且走了20年的彎路。人們最初的想法是讓計(jì)算機(jī)來仿造智能,并且提出了人工智能的概念。學(xué)術(shù)界后來把這樣的方法論稱作“鳥飛派”,意思是說看看鳥是怎樣飛的,就能模仿鳥造出飛機(jī),而不需要了解空氣動(dòng)力學(xué)。(事實(shí)上我們知道,懷特兄弟發(fā)明飛機(jī)靠的是空氣動(dòng)力學(xué)而不是仿生學(xué)。)直到上個(gè)世紀(jì)70年代,人類才找到了適合計(jì)算機(jī)發(fā)展智能的道路,即采用數(shù)據(jù)驅(qū)動(dòng)和大強(qiáng)度計(jì)算。其次,三十年前計(jì)算機(jī)的功能還不夠強(qiáng)大,雖然當(dāng)時(shí)人們以為它已經(jīng)很快了,容量很大了,但是只有今天的十億分之一左右,對(duì)解決智能問題來講是遠(yuǎn)遠(yuǎn)不夠的。而今天,人類正走在機(jī)器智能可能超越人類智能的轉(zhuǎn)折點(diǎn)上。

講到機(jī)器智能(而不是人工智能),首先要搞清楚什么是機(jī)器智能。1950年,計(jì)算機(jī)科學(xué)的先驅(qū)圖靈博士給出了一個(gè)衡量機(jī)器是否有智能的測(cè)試方法:讓一臺(tái)機(jī)器和一個(gè)人坐在幕后,與一個(gè)人(測(cè)試者)展開對(duì)話(比如回答人的問題),當(dāng)測(cè)試者無法被辨別和他講話的是另一個(gè)人還是一臺(tái)機(jī)器時(shí),就可以認(rèn)為這臺(tái)機(jī)器具有和人等同的智能。這種方法被稱為圖靈測(cè)試 (Turing, 1959)。計(jì)算機(jī)科學(xué)家們認(rèn)為,如果計(jì)算機(jī)實(shí)現(xiàn)了下面幾件事情中的一件,就可以認(rèn)為它有圖靈所說的那種智能:

1. 語音識(shí)別,

2. 機(jī)器翻譯,

3. 自動(dòng)回答問題。
2

但是,從1950年代到60年代,機(jī)器智能按照傳統(tǒng)人工智能的路子走得非常不順利,幾乎沒有拿得出手的像樣成果。而與此同時(shí),計(jì)算機(jī)科學(xué)的其他分支都發(fā)展得非常迅速。因此,美國(guó)計(jì)算機(jī)學(xué)界開始反思是否機(jī)器智能走錯(cuò)了路?1968年,著名計(jì)算機(jī)科學(xué)家明斯基在Semantic Information Process一書 (Minsky, 1968)中分析了所謂人工智能的局限性,他引用了Bar-Hillel使用過的一個(gè)非常簡(jiǎn)單的例子:

The pen was in the box.

這句話很好理解,如果讓計(jì)算機(jī)理解它,做一個(gè)簡(jiǎn)單的語法分析即可。但是另一句話語法相同的話:

The box was in the pen.

就讓人頗為費(fèi)解了。原來,在英語中,Pen還有另外一個(gè)不太常用的意思--小孩玩耍的圍欄。在這里,理解成這個(gè)意思整個(gè)句子就通順了。但是,如果用同樣的語法分析,這兩句話會(huì)得到相同的語法分析樹,而僅僅根據(jù)這兩句話本身,是無法判定pen在哪一句話中應(yīng)該作為圍欄,哪一句話應(yīng)該是鋼筆的意思。事實(shí)上,人對(duì)這兩句話的理解并非來源于語法分析和語意本身,而來自于他們的常識(shí),或者說關(guān)于世界的知識(shí)(World Knowledge),這個(gè)問題是傳統(tǒng)的人工智能方法解決不了的。因此,明斯基給出了他的結(jié)論,“目前”(指當(dāng)時(shí))的方法無法讓計(jì)算機(jī)真正有類似人的智能。由于明斯基在計(jì)算機(jī)科學(xué)界崇高的聲望,他的這篇論文導(dǎo)致了美國(guó)政府削減了幾乎全部人工智能研究的經(jīng)費(fèi)。在機(jī)器智能的發(fā)展史上,賈里尼克是一個(gè)劃時(shí)代的人物。1972年,當(dāng)時(shí)還是康奈爾大學(xué)教授的賈里尼克來到IBM沃森實(shí)驗(yàn)室進(jìn)行學(xué)術(shù)休假,并且擔(dān)任起IBM研制智能計(jì)算機(jī)的工作。賈里尼克于是挑選了一個(gè)他認(rèn)為最有可能突破的課題,即語音識(shí)別。

賈里尼克從來不是真正的計(jì)算機(jī)科學(xué)家,而他的專長(zhǎng)是信息論和通信,因此他看待語音識(shí)別問題完全不同于人工智能的專家們--在他看來這是一個(gè)通信問題。人的大腦是一個(gè)信息源,從思考到合適的語句,再通過發(fā)音說出來,是一個(gè)編碼的過程,經(jīng)過媒介(空氣或者電話線)傳播到聽眾耳朵里,是經(jīng)過了一個(gè)長(zhǎng)長(zhǎng)的信道的信息傳播問題,最后聽話人把它聽懂,是一個(gè)解碼的過程。既然是一個(gè)典型的通信問題,就可以用解決通信問題的方法來解決,為此賈里尼克用兩個(gè)馬爾可夫模型分別描述信源和信道。當(dāng)然,為了訓(xùn)練和使用這兩個(gè)馬爾可夫模型,就需要使用大量的數(shù)據(jù)。采用馬爾可夫模型,IBM 將當(dāng)時(shí)的語音識(shí)別率從70%左右提高到90%以上,同時(shí)語音識(shí)別的規(guī)模從幾百詞上升到兩萬多詞 (Jelinek, 1976),這樣,語音識(shí)別就能夠從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用。 賈里尼克和他的同事在無意中開創(chuàng)了一種采用統(tǒng)計(jì)的方法解決智能問題的途徑,因?yàn)檫@種方法需要使用大量的數(shù)據(jù),因此它又被稱為是數(shù)據(jù)驅(qū)動(dòng)的方法。

賈里尼克的同事彼得?布朗在1980年代,將這種數(shù)據(jù)驅(qū)動(dòng)的方法用于了機(jī)器翻譯 (P.F. Brown, 1990)。由于缺乏數(shù)據(jù),最初的翻譯結(jié)果并不令人滿意,雖然一些學(xué)者認(rèn)可這種方法,但是其他學(xué)者,尤其是早期從事這項(xiàng)工作的學(xué)者認(rèn)為,解決機(jī)器翻譯這樣智能的問題,光靠基于數(shù)據(jù)的統(tǒng)計(jì)是不夠的。因此,當(dāng)時(shí)SysTran等公司依然在組織大量的人力,寫機(jī)器翻譯使用的語法規(guī)則。

如果說在1980年代還看不清楚布朗的方法和傳統(tǒng)的人工智能的方法哪一個(gè)更適合計(jì)算機(jī)解決機(jī)器智能問題的話,那么在1990年代以后,數(shù)據(jù)的優(yōu)勢(shì)就凸顯出來了。從1990年代中期之后的10年里,語音識(shí)別的錯(cuò)誤率減少了一半,而機(jī)器翻譯的準(zhǔn)確性提高了一倍,其中20%左右的貢獻(xiàn)來自于方法的改進(jìn),而80%則來自于數(shù)據(jù)量的提升。當(dāng)然,這背后的一個(gè)原因是,由于互聯(lián)網(wǎng)的普及,可使用的數(shù)據(jù)量呈指數(shù)增長(zhǎng)。

最能夠說明數(shù)據(jù)對(duì)解決機(jī)器翻譯等智能問題的幫助的,是2005年NIST對(duì)全世界各家機(jī)器翻譯系統(tǒng)評(píng)測(cè)的結(jié)果。

這一年,之前沒有做過機(jī)器翻譯的Google,不僅一舉奪得了各項(xiàng)評(píng)比的第一名,而且將其它單位的系統(tǒng)遠(yuǎn)遠(yuǎn)拋在了后面。比如在阿拉伯語到英語翻譯的封閉集測(cè)試中,Google系統(tǒng)的BLEU評(píng)分為51.31%,領(lǐng)先第二名將近 5%,而提高這五個(gè)百分點(diǎn)在過去需要研究7—10年;在開放集的測(cè)試中,Google51.37%的得分比第二名領(lǐng)先了17%,可以說整整領(lǐng)先了一代人的水平。當(dāng)然,大家能想到的原因是它請(qǐng)到了世界著名的機(jī)器翻譯專家弗朗茲·奧科(Franz Och),但是參加評(píng)測(cè)的南加州大學(xué)系統(tǒng)和德國(guó)亞琛工學(xué)院系統(tǒng)也是奧科寫的姊妹系統(tǒng)。從奧科在Google開始工作到提交評(píng)比結(jié)果,中間其實(shí)只有半年多的時(shí)間,奧科在方法上沒有做任何改進(jìn)。Google系統(tǒng)和之前的兩個(gè)系統(tǒng)唯一的不同之處在于,前者使用了后者近萬倍的數(shù)據(jù)量。

下表是2005年NIST評(píng)比的結(jié)果。值得一提的是,SysTran公司的系統(tǒng)是唯一采用傳統(tǒng)的語法規(guī)則進(jìn)行機(jī)器翻譯的。它和那些采用數(shù)據(jù)驅(qū)動(dòng)的系統(tǒng)相比,差距之大已經(jīng)不在一個(gè)時(shí)代了。

從阿拉伯語到英語的翻譯 (封閉集)

Google 51.31%
南加州大學(xué) 46.57%
IBM沃森實(shí)驗(yàn)室 46.46%
馬里蘭大學(xué) 44.97%
約翰?霍普金斯大學(xué)  43.48%
……
SYSTRAN公司 10.79%

從中文到英語翻譯 (開放集)

Google 51.37%
SAKHR公司 34.03%
美軍ARL研究所 22.57%

表1 2005年NIST對(duì)全世界多種機(jī)器翻譯系統(tǒng)進(jìn)行評(píng)比的結(jié)果

到了2000年之后,雖然還有一些舊式的學(xué)者死守著傳統(tǒng)人工智能的方法不放,但是無論是學(xué)術(shù)界還是工業(yè)界,機(jī)器智能的主流方法是基于統(tǒng)計(jì)或者說數(shù)據(jù)驅(qū)動(dòng)的方法。與此同時(shí),另外兩個(gè)相關(guān)的研究領(lǐng)域,機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘也開始熱門起來。

2012-2014年,筆者曾經(jīng)負(fù)責(zé)Google的機(jī)器問答項(xiàng)目,并且通過使用大數(shù)據(jù),解決了30%左右的問題,這遠(yuǎn)遠(yuǎn)超過了學(xué)術(shù)界迄今為止同類研究的水平。究其原因,除了Google在自然語言處理等基礎(chǔ)算法上做到了世界領(lǐng)先之外,更重要的是,Google將這個(gè)過去認(rèn)為是存粹自然語言理解的問題變成了一個(gè)大數(shù)據(jù)的問題。首先,Google發(fā)現(xiàn)對(duì)于用戶在互聯(lián)網(wǎng)上問的各種復(fù)雜問題,有70-80%左右的問題可以在前十條自然搜索結(jié)果(去掉廣告、圖片和視頻等結(jié)果)中找到答案,而只有20%左右的復(fù)雜問題,答案存在于搜索結(jié)果的摘要里。因此,Google將機(jī)器自動(dòng)問答這樣一個(gè)難題轉(zhuǎn)換成了在大數(shù)據(jù)中尋找答案的摘要問題。當(dāng)然,這里面有三個(gè)前提,首先答案需要存在,這就是我們前面講到的大數(shù)據(jù)的完備性;其次,計(jì)算能力需要足夠,Google回答這樣一個(gè)問題的時(shí)間小于10毫秒,但是需要上萬臺(tái)服務(wù)器同時(shí)工作;最后,就是要用到非常多的自然語言處理算法,包括對(duì)全部的搜索內(nèi)容要進(jìn)行語法分析和語義分析,要能夠從文字的片段合成符合語法而且讀起來通順的自然語言等等。其中第一個(gè)前提是只有Google等少數(shù)大公司具備,而學(xué)術(shù)界不具備,因此這就決定了是Google而非學(xué)術(shù)界最早解決圖靈留下的這個(gè)難題。

3

圖 3 Google自動(dòng)問答(問題為“天為什么是藍(lán)色的?”,問題下面是計(jì)算機(jī)產(chǎn)生的答案)

由此可見,我們對(duì)數(shù)據(jù)重要性的認(rèn)識(shí)不應(yīng)該停留在統(tǒng)計(jì)、改進(jìn)產(chǎn)品和銷售,或者提供決策的支持上,而應(yīng)該看到它(和摩爾定律、數(shù)學(xué)模型一起)導(dǎo)致了機(jī)器智能的產(chǎn)生。而機(jī)器一旦產(chǎn)生了和人類類似的智能,就將對(duì)人類社會(huì)產(chǎn)生重大的影響了。

2.大數(shù)據(jù)(Big Data)的本質(zhì)

機(jī)器智能離不開數(shù)據(jù),那么大量的數(shù)據(jù)和現(xiàn)在大家所說的大數(shù)據(jù)是否是一回事呢?如果不是,它們之間又有什么聯(lián)系和區(qū)別呢?

毫無疑問,大數(shù)據(jù)的數(shù)據(jù)量自然是非常大的,但是光是“量”大還不是我們所說的大數(shù)據(jù)。比如過去國(guó)家統(tǒng)計(jì)局的數(shù)據(jù)量也很大,但是不是真正意義上的大數(shù)據(jù)。這兩者的差別我們可以從三個(gè)方面來看。

首先,大數(shù)據(jù)具有多維度性質(zhì),而不同維度之間有著天然的(而非人為的)聯(lián)系。為了說明這一點(diǎn),我們不妨看一個(gè)實(shí)際的例子。

2013年9月份,百度發(fā)布了一個(gè)頗有意思的統(tǒng)計(jì)結(jié)果《中國(guó)十大“吃貨”省市排行榜》。百度沒有做任何的民意調(diào)查和各地飲食習(xí)慣的研究,它只是從“百度知道”的7700萬條和吃有關(guān)的問題里“挖掘”出來一些結(jié)論:

在關(guān)于“什么能吃嗎?”的問題中,福建、浙江、廣東、四川等地的網(wǎng)友最經(jīng)常問的是“什么蟲能吃嗎”,江蘇、上海、北京等地的網(wǎng)友最經(jīng)常問“什么的皮能不能吃”,內(nèi)蒙古、新疆、西藏,網(wǎng)友則是最關(guān)心“蘑菇能吃嗎”,而寧夏網(wǎng)友最關(guān)心的竟然是“螃蟹能吃嗎”。寧夏的網(wǎng)頁關(guān)心的事情一定讓福建的網(wǎng)友大跌眼鏡,反過來也是一樣,他們會(huì)驚訝于有人居然要吃蟲子。

百度做的這件小事其實(shí)就是大數(shù)據(jù)的一個(gè)典型應(yīng)用。它有這樣一些特點(diǎn)。首先,它的數(shù)據(jù)量非?!按蟆?。第二,這些數(shù)據(jù)維度其實(shí)非常多,它們不僅涉及到食物的做法、吃法、成分、營(yíng)養(yǎng)價(jià)值、價(jià)格、問題來源的地域和時(shí)間等等,而且里面包含了提問者的很多信息,互聯(lián)網(wǎng)的IP地址,所用的計(jì)算機(jī)(或者手機(jī))的型號(hào),瀏覽器的種類等等。這些維度也不是明確地給出的(這一點(diǎn)和傳統(tǒng)的數(shù)據(jù)庫不一樣),因此在外面人看來,這些原始的數(shù)據(jù)是“相當(dāng)雜亂”,但是恰恰是這些看上去雜亂無章的數(shù)據(jù)將原來看似無關(guān)的維度(時(shí)間、地域、食品、做法,成分,人的身份和收入情況等)聯(lián)系了起來。經(jīng)過對(duì)這些信息的挖掘,加工和整理,就得到了有意義的統(tǒng)計(jì)規(guī)律。

當(dāng)然,百度只公布了一點(diǎn)點(diǎn)大家感興趣的結(jié)果。它完全可以從這些數(shù)據(jù)中得到更多有價(jià)值的統(tǒng)計(jì)結(jié)果。比如,它很容易得到不同年齡人、性別和文化背景(這些很容易挖掘出來)的飲食習(xí)慣,不同生活習(xí)慣的人(比如正常作息的、夜貓子們、經(jīng)常出差的或者不愛運(yùn)動(dòng)的等等)的飲食習(xí)慣等等。如果百度的數(shù)據(jù)收集的時(shí)間跨度足夠長(zhǎng),它還可以看出不同地區(qū)人飲食習(xí)慣的變化,尤其是在不同經(jīng)濟(jì)發(fā)展階段飲食習(xí)慣的改變。而這些看似很簡(jiǎn)單的問題,比如飲食習(xí)慣的變化,沒有百度知道的大數(shù)據(jù),還真難得到。這就是大數(shù)據(jù)多維度的威力。

大數(shù)據(jù)的第二個(gè)特點(diǎn)在于它的完備性。為了說明這一點(diǎn),讓我們?cè)賮砜匆粋€(gè)真實(shí)的案例。從1932年開始,蓋洛普一直在對(duì)美國(guó)總統(tǒng)選舉進(jìn)行預(yù)測(cè),幾十年來它也在不斷地改進(jìn)采樣的方法,力求使得統(tǒng)計(jì)準(zhǔn)確,但是在過去的幾十年里,它對(duì)美國(guó)大選結(jié)果的預(yù)測(cè)可以講是大局(全國(guó))尚準(zhǔn)確,但是細(xì)節(jié)(每一個(gè)州)常常出錯(cuò)。因?yàn)樵俸玫牟蓸臃椒?,也有考慮不周全之處。

但是到了2012年總統(tǒng)選舉時(shí),這種“永遠(yuǎn)預(yù)測(cè)不準(zhǔn)”的情況得到了改變。一位名不見經(jīng)傳的統(tǒng)計(jì)學(xué)家Nate Silver通過對(duì)互聯(lián)網(wǎng)網(wǎng)上能夠取得的各種大量的數(shù)據(jù)(包括社交網(wǎng)絡(luò)上用戶發(fā)表的信息、新聞信息和其它網(wǎng)絡(luò)信息),進(jìn)行大數(shù)據(jù)分析,準(zhǔn)確地預(yù)測(cè)了全部50個(gè)州的選舉結(jié)果,而在歷史上,蓋洛普從來沒有做的這一點(diǎn)。當(dāng)然,有人可能會(huì)問,這個(gè)結(jié)果是否是蒙的?這個(gè)可能性或許存在,但是只有一千萬億分之一,因此可以認(rèn)為這是大數(shù)據(jù)分析的結(jié)果。在這個(gè)例子中,Silver并沒有什么好的采樣方法,只是收集的數(shù)據(jù)很完備。大數(shù)據(jù)的完備性,不僅有用,甚至有點(diǎn)可怕。

大數(shù)據(jù)

圖4. Nate Silver對(duì)2012年美國(guó)大選的預(yù)測(cè)(左)和實(shí)際結(jié)果(右)的對(duì)比(紅色的地方表示共和黨獲勝的州,藍(lán)色的表示民主黨獲勝的州)

數(shù)據(jù)的完備性的作用遠(yuǎn)比準(zhǔn)確預(yù)測(cè)一個(gè)總統(tǒng)選舉大得多,Google無人駕駛汽車便是一個(gè)很好的例子。首先,無人駕駛汽車可以算是一個(gè)機(jī)器人,這點(diǎn)應(yīng)該沒有疑問,因?yàn)樗芟袢艘粯訉?duì)各種隨機(jī)突發(fā)性事件快速地做出判斷。在這個(gè)領(lǐng)域Google只花了六年時(shí)間就做到了全世界學(xué)術(shù)界幾十年沒有做到的事情。在2004年,經(jīng)濟(jì)學(xué)家們還認(rèn)為司機(jī)是計(jì)算機(jī)難以取代人的幾個(gè)行業(yè)之一。當(dāng)然,他們不是憑空得出這個(gè)結(jié)論的,除了分析了技術(shù)上和心理上的難度外,還參考了當(dāng)年DARPA組織的自動(dòng)駕駛汽車?yán)惖慕Y(jié)果--當(dāng)時(shí)排名第一的汽車花了幾小時(shí)才開出8英里,然后就拋錨了。但是,僅僅過了6年后,2010年Google的自動(dòng)駕駛汽車不僅研制出來了,而且已經(jīng)在高速公路和繁華的市區(qū)行駛了14萬英里,沒有出一次事故。

為什么Google能在不到六年的時(shí)間里做到這一點(diǎn)呢?最根本的原因是它的思維方式和以往的科學(xué)家們都不同--它把這個(gè)機(jī)器人的問題變成了一個(gè)大數(shù)據(jù)的問題。首先,自動(dòng)駕駛汽車項(xiàng)目是Google街景項(xiàng)目的延伸,Google自動(dòng)駕駛汽車只能去它“掃過街”的地方,而在行駛到這些地方時(shí),它對(duì)周圍的環(huán)境是非常了解的,這就是大數(shù)據(jù)完備性的威力。而過去那些研究所里研制的自動(dòng)駕駛汽車,每到一處都要臨時(shí)地識(shí)別目標(biāo),這是人思維的方式。其次,Google的自動(dòng)駕駛汽車上面裝了十幾個(gè)傳感器,每秒鐘幾十次的各種掃描,這不僅超過了人所謂的“眼觀六路、耳聽八方”,而且積攢下來的大量的數(shù)據(jù),對(duì)各地的路況,以及不同交通狀況下車輛行駛的模式有準(zhǔn)確的了解,計(jì)算機(jī)學(xué)習(xí)這些“經(jīng)驗(yàn)”的速度則遠(yuǎn)遠(yuǎn)比人快得多,這是大數(shù)據(jù)多維度的優(yōu)勢(shì)。這兩點(diǎn)是過去學(xué)術(shù)界所不具備的條件,依靠它們,Google才能在非常短的時(shí)間里實(shí)現(xiàn)汽車的自動(dòng)駕駛。

大數(shù)據(jù)的第三個(gè)特征在它的英文提法“Big Data”這個(gè)詞當(dāng)中體現(xiàn)的很清楚。請(qǐng)注意,這里使用的是Big Data,而不是Large Data。Big和Large這兩個(gè)單詞有什么區(qū)別呢,Big更主要是強(qiáng)調(diào)抽象意義上的大,而Large是強(qiáng)調(diào)數(shù)量(或者尺寸)大,比如大桌子Large Table。Big Data的提法,不僅表示大的數(shù)據(jù)量,更重要地是強(qiáng)調(diào)思維方式的不同。這種以數(shù)據(jù)為主的新的做法,在某種程度上顛覆了我們長(zhǎng)期以來在科學(xué)和工程上的方法論。在過去,我們強(qiáng)調(diào)做一件事情的因果關(guān)系,通過前提和假設(shè),推導(dǎo)出結(jié)果。但是在大數(shù)據(jù)時(shí)代,由于數(shù)據(jù)的完備性,我們常常是先知道結(jié)論,再找原因(甚至不去找原因),那么我們是否愿意去接受這樣的工作方式。事實(shí)上,在一些具有大數(shù)據(jù)的IT公司里,包括Google,阿里巴巴等,今天已經(jīng)是按照這種思維方式做事情了。Google的產(chǎn)品比競(jìng)爭(zhēng)對(duì)手稍微好一點(diǎn),主要不是靠技術(shù),而是靠它的數(shù)據(jù)比對(duì)手更完備,同時(shí)它愿意用數(shù)據(jù)來解決問題。阿里巴巴的小額貸款能做起來(而其它商業(yè)銀行做不到),其實(shí)就是對(duì)大數(shù)據(jù)思維的一種詮釋。這是一種我們以前完全沒見過的新的思維方式,一種新的方法論。

大數(shù)據(jù)的這三個(gè)特點(diǎn)導(dǎo)致了機(jī)器智能和人具有完全不同的特點(diǎn),它不是通過邏輯推理歸納演繹得出結(jié)論,而是利用大數(shù)據(jù)的完備性和多維度特點(diǎn),直接找到答案。而大數(shù)據(jù)的完備性有可能讓機(jī)器比人更能夠掌控全局,或者說幫助決策者更好地掌握全局。

大數(shù)據(jù)不僅僅是數(shù)據(jù)量大,而在于它的天然多維度特點(diǎn)和它的完備性。數(shù)據(jù)驅(qū)動(dòng)的方法結(jié)合呈指數(shù)增長(zhǎng)的計(jì)算機(jī)性能導(dǎo)致了機(jī)器智能的產(chǎn)生,并且在今天這個(gè)時(shí)間點(diǎn)上可以比肩人類的智能,這才是大數(shù)據(jù)重要的根本原因。機(jī)器智能和人的智能是不同的,它不是依靠人嚴(yán)密的邏輯推理得到問題的答案,而是通過大數(shù)據(jù)的完備性直接找到答案,或者根據(jù)大數(shù)據(jù)多維度的特點(diǎn)找到以前我們無法發(fā)現(xiàn)的規(guī)律性。這將改變我們的思維方式,也就是所謂的采用“大數(shù)據(jù)思維”。

二、大數(shù)據(jù)和機(jī)器智能的井噴式爆發(fā)

大數(shù)據(jù)這個(gè)概念在今天這個(gè)時(shí)間點(diǎn)被提出來,其根本原因是因?yàn)槟柖蓪?dǎo)致互聯(lián)網(wǎng)的發(fā)展,進(jìn)而使得各種數(shù)據(jù)量的急劇增長(zhǎng)(圖5,數(shù)據(jù)增長(zhǎng)的速度快于互聯(lián)網(wǎng)本身增長(zhǎng)的速度)。因此,大數(shù)據(jù)的第一個(gè)來源是互聯(lián)網(wǎng),包括移動(dòng)互聯(lián)網(wǎng)。大數(shù)據(jù)的產(chǎn)生還有第二個(gè)原因,就是傳感器技術(shù)的突破--今天各種手機(jī),各種可穿戴式設(shè)備都有非常精準(zhǔn)的傳感器。而一些傳感器價(jià)格非常便宜(比如RFID,每個(gè)售價(jià)僅四美分),使得每一個(gè)物品都可以裝上一個(gè)。這些傳感器產(chǎn)生了大量的數(shù)據(jù)。

大數(shù)據(jù)

那么大數(shù)據(jù)能有多么完備?未來的機(jī)器能有多么“聰明”?我們看兩個(gè)極端的例子。

1.精確到每一個(gè)細(xì)節(jié)

我們來構(gòu)造兩個(gè)場(chǎng)景,一個(gè)是關(guān)于物品,一個(gè)是關(guān)于人。

我們假定在未來的社會(huì)里,每一件物品上都貼有一個(gè)RFID(指甲蓋大小的不干膠),那么它每經(jīng)過一道(裝有RFID閱讀器)門,都可以記錄下來,這樣我們可以追蹤它從出廠一直到被消費(fèi)掉(或者最終銷毀掉)的每一步。將來顧客在超市買東西時(shí),他不再需要在收銀臺(tái)前排隊(duì),然后一件件掃描商品算賬,而只需要把購(gòu)物車推出裝有RFID閱讀器的大門,而那個(gè)閱讀器將讀出他購(gòu)物車?yán)锩恳患唐罚⑶宜愠鰞r(jià)錢。不僅如此,他還能知道商品的來源,這樣假貨就難有藏身之處。對(duì)于廠家來講,它的意義就更大了,大數(shù)據(jù)可以能建立起廠家和終端用戶的直接聯(lián)系。以前,廠家和客戶之間或多或少隔著一些經(jīng)銷商,因此只能了解自己產(chǎn)品大致的銷售情況(比如哪個(gè)地區(qū)賣了多少),而無法了解細(xì)節(jié)(比如哪個(gè)收入階層在消費(fèi),各個(gè)流通環(huán)節(jié)加價(jià)多少等)。但是在大數(shù)據(jù)時(shí)代,它不僅能夠知道每一件商品買給了誰,甚至能知道中間每一個(gè)流通環(huán)節(jié)里的細(xì)節(jié)。因此,它可以完全根據(jù)市場(chǎng)供需進(jìn)行生產(chǎn),而且可以減少中間環(huán)節(jié)。對(duì)于政府的稅收部門,如果可以備份每一筆交易的每一個(gè)細(xì)節(jié),保證每一筆稅收。當(dāng)時(shí),實(shí)現(xiàn)這一切需要多少IT投入,什么時(shí)候可以完成現(xiàn)在尚難估計(jì)。

接下來談?wù)剬?duì)人的精細(xì)化了解。從理論上講,在大數(shù)據(jù)時(shí)代完全有條件了解每一個(gè)人24小時(shí)的全部行程。對(duì)于使用手機(jī)的人,這件事很容易做到。Google向智能手機(jī)和Chrome的用戶提供一個(gè)被稱為Google Now的個(gè)人資訊服務(wù),它通過大數(shù)據(jù)(利用多維度的特點(diǎn))將用戶在日常生活中使用的很多(網(wǎng)絡(luò))服務(wù)打通,讓使用者可以非常方便地管理每一天的生活。比如,它通過紀(jì)錄使用者不同時(shí)間所在的位置,自動(dòng)了解他的住址和上班的地點(diǎn),每天上下班前,通知用戶路上所需要的時(shí)間和比較好的行程路線,同時(shí)也能通知用戶沿路可能發(fā)生的擁堵和交通事故。它還可以根據(jù)用戶的通信(比如郵件),幫助用戶自動(dòng)地將每天的活動(dòng)自動(dòng)地加到日歷中并且及時(shí)提醒下一個(gè)活動(dòng)。事實(shí)上,用戶在獲得這種方便性的同時(shí),將每天的活動(dòng)全部交給了Google來管理。只要再做進(jìn)一步的數(shù)據(jù)挖掘,擁有這樣大數(shù)據(jù)的公司和機(jī)構(gòu)(不一定需要是手機(jī)制造商和服務(wù)運(yùn)營(yíng)商),不僅可以知道一個(gè)人任何時(shí)刻的位置,而且可以知道他在做什么(比如在打電話,寫郵件,開會(huì)或者工作)等等,甚至可以知道在什么時(shí)候他和什么人見了面(比如兩個(gè)人在某個(gè)地方一起吃了一小時(shí)午飯,吃的是什么飯)。對(duì)于沒有使用手機(jī)的人來講,雖然不能獲得如此詳盡的信息,每天的活動(dòng)也是有辦法知道的。比如只要他身上任何一件物品是可以識(shí)別,或者他的一些生物特征(臉譜、指紋、聲音等)可以識(shí)別,再經(jīng)過大數(shù)據(jù)分析,也能比較詳盡地了解這個(gè)人的活動(dòng)。在過去,針對(duì)非常少量的人,如果不計(jì)成本的話,這件事情也能辦到,但是不可能針對(duì)大范圍的人,而在大數(shù)據(jù)和機(jī)器智能使得了解每一個(gè)人的生活變成了可能。

大數(shù)據(jù)和機(jī)器智能的發(fā)展,必將使得“機(jī)器”能夠準(zhǔn)確地了解社會(huì)的每一個(gè)細(xì)節(jié)。因此,具有最強(qiáng)大智能機(jī)器的不是哪一個(gè)具體的機(jī)器人,而是超級(jí)數(shù)據(jù)中心后面幾十萬,上百萬的服務(wù)器集群。而掌控這個(gè)集群的人實(shí)際上在掌控這個(gè)社會(huì)發(fā)生的一切。

2.對(duì)醫(yī)療衛(wèi)生的影響

近幾十年來,雖然人類的壽命在不斷地延長(zhǎng),但這在很大程度上是靠技術(shù)手段,而不是醫(yī)療本身水平的提高。事實(shí)上,提高醫(yī)療水平是一個(gè)非常漫長(zhǎng)的過程,而過去研制新的藥品和醫(yī)療手段亦是如此。醫(yī)療健保的費(fèi)用不斷增加,而且照此下去各國(guó)將是不堪負(fù)荷的,據(jù)估計(jì)到2020年,美國(guó)用于醫(yī)療健保的費(fèi)用將達(dá)到GDP的20%左右。

那么出路在哪里?今天IT界和醫(yī)學(xué)界領(lǐng)域都有一個(gè)共識(shí),就是通過IT的進(jìn)步,尤其是大數(shù)據(jù)和機(jī)器智能的進(jìn)步,幫助解決人類健康的問題。當(dāng)然,這個(gè)話題很大大,我們可以從三個(gè)側(cè)面來看看在未來IT技術(shù)對(duì)生物醫(yī)療的幫助。

首先,藥品的研制。攻克癌癥是人類的一個(gè)夢(mèng)想,但是迄今為止沒有一種特效的抗癌藥能夠治愈癌癥。過去醫(yī)學(xué)界還試圖研制這樣的抗癌藥,但是后來醫(yī)學(xué)界認(rèn)識(shí)到,由于癌細(xì)胞本身的基因會(huì)變異,因此并不存在這樣一種萬能藥?;谶@一點(diǎn)共識(shí),醫(yī)學(xué)界改變了治療癌癥的思路,那就是針對(duì)特定患者(不斷變化的癌細(xì)胞),研制特定的藥物,從理論上講,只要研制的速度超過癌細(xì)胞變化的速度,癌癥就可以治愈了。

按照傳統(tǒng)的藥品研發(fā)思路,科學(xué)家們應(yīng)該先研究病理,找到解決方法(比如阻止具有某種基因的癌細(xì)胞蛋白質(zhì)的合成),然后找到相應(yīng)的藥物,進(jìn)行各種動(dòng)物實(shí)驗(yàn)和臨床試驗(yàn)。這是我們前面提到的強(qiáng)調(diào)因果關(guān)系的工作方法。但是,按照這個(gè)思路,為每一位癌癥患者研制一種新藥是很難辦到的。且不說制藥公司能否安排一個(gè)專門的團(tuán)隊(duì)為一個(gè)特定的患者服務(wù),就算是能做到這一點(diǎn),研制新藥的成本也是患者無法負(fù)擔(dān)的-平均一個(gè)人要十億美元(基因泰克公司董事長(zhǎng)李文森博士的估計(jì))。事實(shí)上,不僅研制抗癌藥成本高周期長(zhǎng),在美國(guó),任何一種有效的處方藥研制的時(shí)間和費(fèi)用都非常高。過去大約需要十年時(shí)間,十億美元,今天這個(gè)過程并沒有縮短,而成本甚至上升到近百億美元。

針對(duì)這種困境,科學(xué)家們想到了利用大數(shù)據(jù)來解決問題。在美國(guó)有大約5000多種處方藥(遠(yuǎn)比一般人想象的少),過去每一種處方藥都是用于當(dāng)初針對(duì)的那些疾病的,比如治療心臟病的藥物就是用于心臟病的。但是,今天通過大數(shù)據(jù)統(tǒng)計(jì)研究發(fā)現(xiàn),一款治療心臟病的藥物對(duì)于胃病的治療效果明顯。按照大數(shù)據(jù)的思維方式,我們應(yīng)該先接受這個(gè)結(jié)論,再反過來找原因?;谶@樣的方法,找到治療一種疾病的藥品的組合,成本比以前研制新藥成本要降低至少一個(gè)數(shù)量級(jí),而時(shí)間可以縮短70-80%。根據(jù)著名生物系統(tǒng)專家、基因泰克公司董事長(zhǎng)阿瑟?李文森博士的估計(jì),采用大數(shù)據(jù)有望實(shí)現(xiàn)針對(duì)每一位癌癥患者量身定制藥物和治療方法,而成本可以降到每個(gè)人五千美元。

其次,基因科技和醫(yī)療診斷。2012年Google科學(xué)比賽的第一名授予了一位來自威斯康星的高中生,她通過對(duì)760萬個(gè)乳腺癌患者的樣本數(shù)據(jù)的機(jī)器學(xué)習(xí),設(shè)計(jì)了一種確定乳腺癌癌細(xì)胞位置的算法,來幫助醫(yī)生對(duì)病人進(jìn)行活檢,其位置預(yù)測(cè)的準(zhǔn)確率高達(dá)96%,超過目前專科醫(yī)生的水平??梢灾v,她的成功在很大程度上得益于大數(shù)據(jù)。這個(gè)例子只是眾多通過IT技術(shù)來幫助疾病診斷的成功案例之一。一些類似的軟件已經(jīng)開始商用化。

大數(shù)據(jù)對(duì)醫(yī)療診斷的另一個(gè)主要的應(yīng)用在于將人類的基因圖譜和各種疾病聯(lián)系起來,從而找到可能致病的基因并且設(shè)法修復(fù)。如果這件事情能夠完成,那么不僅有希望治愈很多過去因?yàn)榛蛉毕菀鸬慕^癥(比如癌癥、帕金森綜合癥等),甚至有可能逆轉(zhuǎn)人類的衰老過程。2013年,Google成立了它的醫(yī)療保健分公司Calico,并且聘請(qǐng)了李文森博士擔(dān)任CEO,其第一期的投入已經(jīng)高達(dá)10億美元。據(jù)李文森博士介紹,采用傳統(tǒng)的醫(yī)學(xué)研究的方式,要想找到導(dǎo)致老年癡呆的基因并且找到治療方法,在他有生之年(1950年出生)可能是看不到的,但是利用大數(shù)據(jù),則有可能辦到。

第三、醫(yī)療機(jī)器人。約翰?霍普金斯大學(xué)的羅素?泰勒教授是全世界最有權(quán)威的醫(yī)療機(jī)器人專家。根據(jù)他的專利制造的手術(shù)機(jī)器人達(dá)?芬奇已經(jīng)成功地在全世界進(jìn)行了150萬例的手術(shù),包括前列腺摘除,心臟瓣膜修復(fù)等。據(jù)泰勒教授介紹這種造價(jià)兩百萬美元的機(jī)器人采用了非常多的跨學(xué)科的技術(shù),具體到IT領(lǐng)域,其核心技術(shù)包括圖像處理和圖像識(shí)別,3D圖像的復(fù)原,統(tǒng)計(jì)模型等等。為了制造這個(gè)機(jī)器人,科學(xué)家們從醫(yī)學(xué)院里收集了大量的數(shù)據(jù),建立各種模型,從而讓它擁有了一個(gè)非常見多識(shí)廣的大腦。相比醫(yī)生,手術(shù)機(jī)器人最大的好處在于它的穩(wěn)定性--即不會(huì)因?yàn)榍榫w而影響手術(shù)效果。從2000年這種機(jī)器人被FDA批準(zhǔn)使用后,目前全球已經(jīng)裝備了3000多臺(tái),其中三分之二在美國(guó)。在未來,這一類的醫(yī)療機(jī)器人會(huì)越來越多地被使用。

第四、可穿戴式設(shè)備改變生活習(xí)慣。在大數(shù)據(jù)時(shí)代,可穿戴式設(shè)備將扮演很多角色,和以往互相不關(guān)聯(lián)的電子設(shè)備不同,它有可能將人一天24小時(shí)都連到互聯(lián)網(wǎng)上。使用者(和背后的大數(shù)據(jù)公司)可以通過可穿戴式設(shè)備了解到每他的生活習(xí)慣和健康狀況。這可以為疾病診斷提供準(zhǔn)確的數(shù)據(jù),試想一下,7天24小時(shí)監(jiān)控的心跳和血壓數(shù)據(jù),一定比在醫(yī)院一次測(cè)量的數(shù)據(jù)更加準(zhǔn)確地反應(yīng)了一個(gè)人的健康狀況。每個(gè)人的健康數(shù)據(jù)將來還可以作為醫(yī)療保險(xiǎn)收費(fèi)的憑據(jù),并且?guī)椭藗凁B(yǎng)成一個(gè)良好的生活習(xí)慣。在美國(guó),一些保險(xiǎn)公司正在嘗試給愿意使用可穿戴式設(shè)備,并且證明有良好生活習(xí)慣的人較低的保費(fèi)。

可以預(yù)見,在不久的將來,IT技術(shù)尤其是大數(shù)據(jù)和機(jī)器智能技術(shù)在醫(yī)療保健上的應(yīng)用會(huì)越來越多,并且將極大地改善人類的生活。

3.智能機(jī)器(機(jī)器人)

在2015年拉斯維加斯的消費(fèi)電子產(chǎn)品展CES上,各廠家都用“所有東西皆智能(Smart Everything)”來吸引觀眾。當(dāng)然,機(jī)器人(包括無人機(jī))是展覽會(huì)上的一個(gè)亮點(diǎn)。

無人機(jī)本身已經(jīng)不是什么新鮮事,但是美國(guó)一家小公司SkyCatch則將它們的智能水平提到一個(gè)新的高度。這家公司讓智能機(jī)的操作完全(比如換電池、換硬盤)由機(jī)器人來完成,用戶只需要定義任務(wù)即可。蘋果公司是SkyCatch的客戶之一,目前租用無人機(jī)服務(wù)監(jiān)控它的新總部施工情況,每天無人機(jī)要出動(dòng)六、七次到工地上空拍攝出全部的工程進(jìn)展錄像和照片,能了解工地建設(shè)從第一天到最后一天全部的細(xì)節(jié)。

由于在地面為無人機(jī)服務(wù)的是是機(jī)器人,能派出的無人機(jī)的數(shù)量可以非常多,頻率也可以非常高。如果我們把這件事想得遠(yuǎn)一點(diǎn),無人機(jī)可以查出一個(gè)城市全部的違章建筑,任何地方的交通狀況,對(duì)農(nóng)業(yè)收成的估計(jì)、礦山和工地的勘察等等。如果把這種機(jī)器人能夠做的事情再進(jìn)一步擴(kuò)展,變成為固定機(jī)翼的無人機(jī)裝卸燃料,那么就構(gòu)成了一直非??膳碌目哲姟?/p>

如果我們?cè)侔褵o人駕駛汽車看成一個(gè)種能在地面上行駛的機(jī)器人,那么它們經(jīng)過改裝,可以變成為反恐服務(wù)的巡邏車。當(dāng)然,這些要以進(jìn)一步的機(jī)器智能和大數(shù)據(jù)研究為基礎(chǔ)。

當(dāng)然,智能機(jī)器最關(guān)鍵的不在于可以移動(dòng)的“四肢”,而在于它的大腦。在這超級(jí)“機(jī)器大腦”的控制下,智能機(jī)器可以完成很多人難以完成的事情,從在生產(chǎn)線上取代工人,到取代那些職業(yè)人士(金融、法律和醫(yī)生)。這些在過去看似不可能的事情,今天正在發(fā)生。關(guān)于這一點(diǎn),我們下面會(huì)詳細(xì)論述。

四、大數(shù)據(jù)、機(jī)器智能和未來社會(huì)

機(jī)器智能無疑可以幫助改善人類的生活,包括延長(zhǎng)人的壽命,但另一方面,我們?cè)跉g呼機(jī)器智能到來的同時(shí),是否準(zhǔn)備好了它對(duì)未來社會(huì)帶來的沖擊呢。技術(shù)革命的作用常常是正反兩方面并存的。我們從對(duì)制造業(yè)、服務(wù)業(yè)和國(guó)家安全幾個(gè)層面的影響來說明它。

2011年德國(guó)提出工業(yè)4.0的概念,即通過數(shù)字化和智能化來提升制造業(yè)的水平。其核心則是通過智能機(jī)器、大數(shù)據(jù)分析來幫助工人甚至取代工人,實(shí)現(xiàn)制造業(yè)的全面智能化。這在提高設(shè)計(jì)、制造和供應(yīng)銷售效率的同時(shí),也會(huì)大大減少產(chǎn)業(yè)工人的數(shù)量。在中國(guó),全球最大的OEM制造商富士康,一直在研制取代生產(chǎn)線上工人的工業(yè)機(jī)器人。富士康預(yù)計(jì)未來它將有上百萬的機(jī)器人取代裝配線上的工人。這一方面使得工人們不再需要到生產(chǎn)線上去從事繁重而重復(fù)性的工作,另一方面則使得工廠里的工人數(shù)量將大幅度地減少。

當(dāng)然,很多人會(huì)說,自從大機(jī)器出現(xiàn)后,工人的數(shù)量就在減少,但是勞動(dòng)力會(huì)被分配到其他行業(yè)。但是,如同在2004年經(jīng)濟(jì)學(xué)家低估了機(jī)器可以取代駕駛員的可能性一樣,今天我們可能在低估機(jī)器智能對(duì)未來社會(huì)的沖擊。這一次由機(jī)器智能引發(fā)的技術(shù)革命,不僅僅是替代那些簡(jiǎn)單的勞動(dòng),而將在各個(gè)行業(yè)取代原有的從業(yè)人員,因?yàn)檫@將是人類歷史上第一次,機(jī)器在智能方面超越人類。我們不妨看看機(jī)器智能對(duì)那些最需要專業(yè)技能的行業(yè)帶來的沖擊。

在美國(guó),專科醫(yī)生,比如放射科醫(yī)生,是社會(huì)地位和收入最高的群體,也是需要專業(yè)知識(shí)最多,智力水平最高的群體--他們需要在大學(xué)和醫(yī)院學(xué)習(xí)和訓(xùn)練13年(平均)才能獲得行醫(yī)的執(zhí)照。這樣的工作,過去被認(rèn)為是不可能被機(jī)器取代的。但是,今天智能的模式識(shí)別軟件通過醫(yī)學(xué)影像的識(shí)別和分析,可以比有經(jīng)驗(yàn)的放射科醫(yī)生更好地診斷病情,而這個(gè)成本,只是人工的百分之一。

律師,也被認(rèn)為是最“高大上”的職業(yè),但是他們的工作受到了自然語言處理軟件的威脅。今天,打一場(chǎng)像蘋果vs三星這樣的官司,要分析和處理上百萬份法律文件(因?yàn)槊绹?guó)是判例型法律),律師費(fèi)高得驚人。但是,位于硅谷Palo Alto的 Blackstone Discovery公司發(fā)明了一種處理法律文件的自然語言處理軟件,使得律師的效率可以提高500倍,而打官司的成本可以下降99%。這意味著未來將有相當(dāng)多的律師可能失去工作。事實(shí)上這件事情在美國(guó)已經(jīng)發(fā)生,新畢業(yè)的法學(xué)院學(xué)生找到正式工作的時(shí)間比以前長(zhǎng)了很多。

面對(duì)勢(shì)不可擋的機(jī)器智能大潮,人類在未來需要重新考慮工作和生活的方式了,尤其是勞動(dòng)力的出路問題。從一百多年前開始的農(nóng)業(yè)革命使得發(fā)達(dá)國(guó)家2-5%[注釋:根據(jù)美國(guó)勞工部的統(tǒng)計(jì),美國(guó)農(nóng)業(yè)工人占不到勞動(dòng)力人口的2%。]的人提供了全部人口所需的食品,隨著機(jī)器智能的發(fā)展,或許只需要5%以下的勞動(dòng)力就能提供人類所需的所有工業(yè)品和大部分的服務(wù)工作。當(dāng)然,會(huì)有一小部分人參與智能機(jī)器的研發(fā)和制造,但是這只會(huì)占到勞動(dòng)力的很小一部分。那么,我們現(xiàn)在必須考慮未來勞動(dòng)力的出路在哪里?這是一個(gè)在機(jī)器智能發(fā)展過程中無法回避的問題。

在歷史上,第一次工業(yè)革命(1760-1820)一方面極大地解放了生產(chǎn)力,并且使得人類第一次生產(chǎn)的產(chǎn)品超過了消費(fèi)的需求。當(dāng)時(shí)在世界上真正受益的只有英國(guó),起產(chǎn)業(yè)工人不過數(shù)百萬而已。即便如此,它也感覺到市場(chǎng)不夠用,以至于它需要進(jìn)行全球性市場(chǎng)的拓展。亞當(dāng)斯密的《國(guó)富論》誕生于那個(gè)年代有它的歷史背景。在這本經(jīng)典經(jīng)濟(jì)學(xué)著作中,亞當(dāng)斯密闡述了英國(guó)開放市場(chǎng)的重要性,而其目的是換取他國(guó)同樣地開放市場(chǎng)。這次工業(yè)革命進(jìn)行了六十年,有兩代人的時(shí)間消化它帶來的沖擊力,但是在很長(zhǎng)時(shí)間里,社會(huì)依然無法承受。在19世紀(jì)上半葉,是英國(guó)勞資矛盾最突出的時(shí)期,狄更斯等人的小說里描寫的工人們悲慘的景象,便是在那個(gè)時(shí)期,而馬克思主義也恰恰是在那個(gè)時(shí)代誕生的。直到19世紀(jì)中,英國(guó)才形成一個(gè)相對(duì)穩(wěn)定的中產(chǎn)階級(jí)群體,而靠著對(duì)外貿(mào)易,英國(guó)在19世紀(jì)中期進(jìn)入它的維多利亞榮光時(shí)代,其標(biāo)志為1855年首屆世博會(huì)。如果從1760年算起,英國(guó)整整花了一個(gè)世紀(jì)才消化工業(yè)革命帶來的負(fù)面影響,這還是在全世界獨(dú)此一國(guó)進(jìn)入工業(yè)化時(shí)代的前提下。

第二次工業(yè)革命(1870-1914)也歷時(shí)了近半個(gè)世紀(jì),電的使用幫助美國(guó)和德國(guó)超越了英國(guó),并且成為人類歷史上財(cái)富增長(zhǎng)最快的時(shí)期。在美國(guó)一方面造就了范德比爾特、卡內(nèi)基和洛克菲勒等商業(yè)巨子(在全世界有史以來最富有的75人中,有五分之一出現(xiàn)在第二次工業(yè)革命時(shí)期的美國(guó)),但是另一方面,這也是美國(guó)社會(huì)公平性最受破壞的事情。最后,經(jīng)過老羅斯福、塔夫特和威爾遜三任總統(tǒng)反壟斷的努力以求恢復(fù)社會(huì)的公平性、經(jīng)過了一次大戰(zhàn)從債務(wù)國(guó)變成債權(quán)國(guó),直到20世紀(jì)20年代,才迎來了柯立芝繁榮。這前后也花了半個(gè)多世紀(jì)來適應(yīng)這次產(chǎn)業(yè)革命。

大數(shù)據(jù)

在從上個(gè)世紀(jì)末開始的所謂第三次浪潮的信息革命中,美國(guó)無疑是一個(gè)領(lǐng)跑者和贏家,但是美國(guó)大部分民眾在經(jīng)濟(jì)上和幸福指數(shù)上其實(shí)并沒有什么提升(圖3,美國(guó)家庭在扣除通貨膨脹后收入的增長(zhǎng),最左邊是收入排在50%-75%的家庭,中間是排在25%-50%的家庭,右邊是最富有的5%的家庭)和(圖4,美國(guó)人幸福指數(shù)的變化)。

大數(shù)據(jù)
這一次將由機(jī)器智能帶了的革命,對(duì)社會(huì)的沖擊將是全方位的。社會(huì)結(jié)構(gòu)可能會(huì)發(fā)生根本性的變化,這可能不是簡(jiǎn)單地把農(nóng)業(yè)人口變成城市人口,把第一第二產(chǎn)業(yè)變成第三產(chǎn)業(yè)這么簡(jiǎn)單。第一次工業(yè)革命和第二次工業(yè)革命還有半個(gè)世紀(jì)左右的時(shí)間消化吸收這些變化,但是這一次由于機(jī)器智能和大數(shù)據(jù)帶來的革命來得非常之快,涉及的領(lǐng)域非常之多,以至于我們未必會(huì)有很長(zhǎng)的時(shí)間來應(yīng)對(duì),社會(huì)將如何適應(yīng)這種變化,是決策者現(xiàn)在需要考慮的問題。

本文刊于《文化縱橫》2015年4月號(hào)。圖片來自網(wǎng)絡(luò)。

End.

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 国产一区二区三区免费看 | 国产精品在线观看 | 亚洲欧美国产高清va在线播放 | 中文字幕亚洲综久久2021 | 国产福利一区二区三区在线视频 | 国产精品不卡在线观看 | 婷婷色基地 | 国产精品免费在线播放 | 亚洲视频一区在线播放 | 女孕学护士一级毛片 | 国产成人女人视频在线观看 | 国产福利视频网站 | 深夜色 | 久揄揄鲁一二三四区高清在线 | 手机看片国产永久1204 | 波多野结衣久久 | 亚洲视频在线一区二区三区 | 久久综合色婷婷 | 欧美一级级毛片 | 色婷婷资源网 | 亚洲精品在线免费 | 超清中文乱码字幕在线观看 | 免费一级欧美片在线观看 | 国产精品午夜久久久久久99热 | jizz孕妇孕交 | 99在线观看国产 | 成人性生免费视频 | 看免费一级毛片 | 欧美jizz40性欧美 | 狠狠综合久久久久综合 | 每日更新国产精品视频 | 波多野结衣一区二区三区四区 | 欧美大狠狠大臿蕉香蕉大视频 | 欧美三级中文字幕 | 亚洲成a人片在线观看精品 亚洲成a人一区二区三区 | 国产成人综合视频 | 免费国产一区二区在免费观看 | 欧美日韩网站 | 久久天天躁夜夜躁狠狠躁2015 | 国产成人综合网亚洲欧美在线 | 一级特级aaaa毛片免费观看 |