今日頭條實驗室李磊:我們離會思考的機器人還有多遠(yuǎn)?
在剛剛結(jié)束的CCAI上,今日頭條科學(xué)家李磊同我們分享了一些他對機器學(xué)習(xí)未來發(fā)展方向的一些思考,以及在此基礎(chǔ)上討論了一下我們還要做些什么才能向通用型AI再靠近一點的問題。今日頭條最初是一家新聞聚合平臺,但素有應(yīng)用AI來解決問題的傳統(tǒng)。最近今日頭條也做出了自己的新聞機器人,在里約奧運期間自動完成了大量的報道。而李磊作為有著多年機器學(xué)習(xí)、人工智能和深度學(xué)習(xí)領(lǐng)域研究經(jīng)驗的科學(xué)家。在這個問題上也有著自己的看法。
李磊在演講中說,要弄清楚我們離通用機器人還有多遠(yuǎn),首先要弄明白三個方面:一是人工智能是什么?二是現(xiàn)在我們能做到什么程度?在搞清楚這兩個問題后我們才能去研究第三個方面:我們的局限在哪里?我們的挑戰(zhàn)在哪里?我們怎樣走到明天?
實際上不僅是李磊,有許多嘉賓在大會的演講和討論中都提到:我們需要管理好自己和消費者對人工智能的認(rèn)知。目前大眾對人工智能的期待普遍偏高,如果我們沒有辦法在短時間內(nèi)將人工智能的實際水平提升到這種期望值的高度(實際上我們目前基本上不可能做到),那說不定過高期望的幻滅會導(dǎo)致新一輪的低谷。所以,我們需要時時刻刻提醒自己目前的人工智能處于一種什么狀態(tài)。
什么是人工智能?
什么是人工智能呢?李磊說,人工智能其實有兩種定義。一種叫類人工智能,就是讓機器像人那樣去思考,去決策、去解決問題,具備學(xué)習(xí)能力,同時還能有行動能力??傊?,就是一切方面都以人為參考。
還有一種定義叫理性智能。理性智能的目標(biāo)并不是把機器去跟人比,而是把計算看成是一個自然現(xiàn)象,研究這個自然現(xiàn)象在智能這個領(lǐng)域到底能夠做到什么樣的合理的水平,以及能夠怎么樣來做工作。
人工智能能做到什么程度?
人工智能的研究內(nèi)容很廣,機器學(xué)習(xí)只是其中的一塊。在具體的一些問題上,人工智能已經(jīng)達(dá)到,甚至超越了人類的水平。李磊在這方面舉了很多例子,包括大家都熟知的AlphaGo,機器人看圖說話、以及今日頭條最近開發(fā)的奧運新聞機器人。越來越多以前由人來完成的工作已經(jīng)可以用機器人來做了。在這些具體的領(lǐng)域內(nèi),機器人的能力已經(jīng)達(dá)到甚至超越了人類。
我們的局限和挑戰(zhàn)在哪里?
不過李磊表示,我們離通用型人工智能其實還很遙遠(yuǎn)。他說,在研究中他們發(fā)現(xiàn),深度學(xué)習(xí)目前最擅長的問題,是那些“有監(jiān)督學(xué)習(xí)”的問題。他之前舉的很多例子,依賴的都是有監(jiān)督學(xué)習(xí)。
不過李磊說,我們要知道,人工智能,或者說機器學(xué)習(xí),不僅僅是有監(jiān)督學(xué)習(xí),也不僅僅是深度學(xué)習(xí),人工智能需要解決的問題其實比這要多得多。而且目前的深度學(xué)習(xí)盡管表現(xiàn)的很好,但其實它也有很多局限性。比如它依賴于大量有標(biāo)注的數(shù)據(jù)。而過去獲得這么多有標(biāo)注的數(shù)據(jù),其實要付出的代價是非常高的,即使是今天,也有很多人沒有條件去獲取如此多的數(shù)據(jù)。
深度學(xué)習(xí)的另外一點局限性是它的通用性還不夠強,下棋的程序只會下棋,識別貓狗的程序只會識別貓狗。你讓他們?nèi)プ鰟e的事情,幾乎不可能做到。
我們應(yīng)該做哪些努力?
李磊表示,我們可以嘗試去解決,以推動機器學(xué)習(xí)發(fā)展的問題有三個:
一是,我們需要發(fā)展它的可解釋性,(也可以說是理論基礎(chǔ)),當(dāng)機器學(xué)習(xí)表現(xiàn)得好或者不好,成功或失敗的時候,我們需要從原理上明白它為什么會有這樣的表現(xiàn),這樣我們才能從根本上對其進(jìn)行提高。
第二是:希望機器學(xué)習(xí)能夠做更多的推理,而不是簡單的判斷。
第三是過去的研究中,發(fā)現(xiàn)機器學(xué)習(xí)需要非常多的計算資源來訓(xùn)練,要使用非常多的GPU和計算機來訓(xùn)練,在這同時也消耗了非常多的能量,李磊表示,他希望能找到一種方法把能耗降下來,在不需要這么夸張的計算能力和能耗的同時,也能達(dá)到不錯的效果。如果能做到這三點,相信我們在機器學(xué)習(xí)的研究上能夠更進(jìn)一步。