人工智能的「最強大腦」到底是怎樣煉成的?
2017 年 1 月 6 日,在粉絲千呼萬喚中,《最強大腦第 4 季》拉開帷幕。和前幾季不同的是,這個節目一開始就火藥味十足。最強大腦節目組特別邀請了百度機器人進行人機大戰。
令所有人驚訝的是,在三局比賽中,除了第二局的聲音識別賽上,聽音「神童」孫亦廷與小度機器人以 1:1 打成平手外,其余的兩場比賽,王峰(世界記憶王)和王昱珩(鬼才之眼)分別以 2:3 和 0:2 敗給了小度機器人。
▲百度 AI 參加《最強大腦》
實際上,AI 在真人秀上碾壓人類的戲碼,早在 2011 年,就在美國 NBC 電視臺的智力競答節目《危險邊緣》中就上演過了。
當時完勝人類的 AI 選手,正是 IBM 研發多年的人工智能——Watson,今天,極客君就和大家聊聊這顆「最強大腦」的故事。
十項全能的人工智能
《危險邊緣》是一檔問答競賽節目,擁有一個非常龐大的數據庫,隨機抽選兩萬道題目,涵蓋 2500 種題目類型,一臺普通的計算機平均要花 2 個小時才能答一道題。
2011 年,和 Watson PK 的是史上連續獲勝 74 場的肯·詹寧斯(Ken ·Jennings),以及拿過 325 萬美元獎金的布拉德·魯特爾(Brad · Rutter 是當時贏錢最多的的吉尼斯世界紀錄保持者)。
結果讓人大跌眼鏡,整場比賽基本上就是 Watson 的個人秀,最終人工智能以絕對優勢獲勝。
▲ Watson 和人類同臺競技
經此一役,Watson 在人工智能界一戰成名!不過,IBM 對 Watson 的開發可不僅僅是答題而已。在各行各業你都能看到 Watson 大展身手。
設計一條會讀心的裙子
在 2016 年的紐約 Met Gala 服裝展覽會上,IBM Watson 和設計師瑪切薩共同推出了一款「認知禮服」。
這條裙子上共鑲有 120 朵花瓣,每朵花瓣上都帶有一只小小的 LED 燈,LED 燈與 IBM Watson 相連。Watson 每秒都會讀取與服裝主人相關的所有 twitter,每一秒都可以通過 LED 燈顏色的變化實時反應粉絲情緒的波動。
▲ Watson 輔助設計的「認知禮服」
無人車的貼心司機
開源汽車制造商 Local Motors推出的無人駕駛公交車 Olli 上就搭載了 Watson 智能助手。借助汽車搭載的 30 個傳感器,Watson 可以通過云端計算分析實時路況。
當乘客乘車時,可以直接與 Watson 對話,告訴它想去的地點,公車就能自動帶你前往目的地。Watson 還會根據乘客的個人愛好,帶你去游覽當地的各種網紅店、旅游勝地。
▲無人公車智能助手的概念演示
Watson 在醫療領域也有一番作為,利用人工智能的圖像識別能力、強大的計算能力和學習能力,Watson 可以通過分析大量的病歷來為醫生提供輔助建議,甚至可以用于鑒別癌癥:
▲通過圖像識別病變組織
如何成為人工的「最強大腦」?
Watson 是 IBM 基于假設認知、大規模證據搜集、分析、評價等深度問答(Deep QA)技術而開發的一個集高級自然語言處理、信息檢索、知識表示、自動推理、機器學習等功能的開放式人工智能。
Watson 可以對自然語言進行處理,通過分析、總結、推理、判斷,然后做決定。這種處理問題的方式,就像「人腦」一樣。實際上,Watson 并沒有創造一個新算法,它只是能以模擬人腦的方式去思考。
▲ Watson 的真身其實就是超級計算機
Watson 一般這樣找答案:它先給自己提個問題,然后像人一樣問自己:這個問題到底問的是什么?它有哪些解決辦法?用哪種方法解決問題會比較好?
基于這些最初的判斷,Watson 會通過快速執行數百個經過驗證的語言分析算法來找「正確答案」。Watson 會判斷,哪些信息重要,哪些信息不重要,重要的信息就做個標記。它會問自己:我找了多少文件了?這些文件從哪兒來的?
▲ Watson 是解決問題的思路演示
就像我們做閱讀理解一樣,Watson 也能「理解」上下文,它還會對內容和形式打分。在過濾信息時,Watson 會問自己:哪個證據能否證明是正確答案,對每個選擇來說有多少與正確答案相關的信息在那里?
值得注意的是,如果「發現」自己的選擇是錯的,Watson 還會「想辦法」節省時間。Watson 每次都會給自己的答案打一個預判分。然后再進一步判斷:這些備選答案中,哪個才是我要找的答案?
▲ Watson 能為各種可能性打分
就像學生考試一樣,通過做各種「閱讀理解」題,Watson 也會拿到一個成績單。這份成績單上,寫滿每道大題的總分。
此時Watson需要做的就是「合并同類項」,將同類型大題的分數加在一起,然后它就會知道:最高的分數是哪個?分數第二高的又是哪個? 此時,如果沒有其他額外的變量,最高分的那個就是 Watson 拿到的「正確答案」了。
Watson 就是這樣基于知識上的關聯,編制了一張大數據網,來進行自我學習。實際上,提問、理解、分析、判斷、打分,這些事人也可以做。
Watson 的獨特之處在于,它可以從類型、時間、空間、流行度、段落支持度、來源可靠度、語義相關度等不同的維度,運用上百種算法來分析問題。
▲通過不同的維度分析,得出正確率最高的答案
這就像投資學家查理·芒格投資股票一樣,通過上百種模型分析問題,他能更具有全局意識,從而也相對容易的看出問題的實質。
這也是 Watson 的意義所在,單純的看,每個維度上,Watson 在評分器上打分的影響不超過 1 %,但將這些維度組合到一個系統內時,Watson 找到答案的「平均精確度」卻高達 92%!
這才是 Watson 的過人之處!
Geek君有話說
驗證人工智能是否成功,我們經常會提到「圖靈測試」:
測試者在與被測試者(一個人和一臺機器)隔開的情況下,通過一些裝置(如鍵盤)向被測試者隨意提問。進行多次測試后,如果有超過30%的測試者不能確定出被測試者是人還是機器,那么這臺機器就通過了測試,也就擁有了人工智能。
人工智能要通過「圖靈測試」,「撒謊」將會是他們的必備技能。
如果有一天,Watson 為了不讓人看出自己的意圖而故意犯錯,就像電影《機械姬》中的機器人伊娃一樣,那么我們人類,又將何去何從呢?