比起人工智能,我更怕人工智障
本文來自微信公眾號: 中科院物理所 (ID:cas-iop) ,作者:Tom?Siegfried,翻譯:zhenni,編輯:藏癡,頭圖來自:《超體》
星際日期24世紀的47025.4,星際艦隊的星際機器人中尉指揮官戴塔被他的反叛機器人“兄弟”洛爾征召加入反叛人類的行列——這令企業號艦長讓-呂克·皮卡德感到非常不安。“碳基生物的統治即將結束,”洛爾告訴皮卡德,“你,皮卡德,以及像你這樣的人都已經過時了。”
這就是電影中《星際迷航》所表達的樂觀態度,即機器們至少要三個世紀后才可能廢黜人類。這只是科幻電影中的情形,而在現實生活中,智能機器已經邁出了接管世界的第一步,他們的時代已經到來。
作為人工智能寬泛概念中的一個較為具體的子領域, 機器學習已經滲透到了從醫療診斷到尋找新亞原子粒子等多個人類深耕的領域。 深度學習是機器學習最強大的體現,它在語音識別、語言翻譯、圖像識別、汽車駕駛、新材料設計以及股市趨勢預測等多方面具有應用。
計算神經科學家塞爾在一篇文章中寫道:“由于計算機可以毫不費力地處理天量數據, 因此深度學習不光能重塑現代社會,還可能掀起科學革命 ——主要涵蓋從粒子物理和有機化學到生物學研究和生物醫學應用這樣的學科。”
近些年來,數量激增的關于機器學習、深度學習和人工智能的新論文涌入了科學文獻庫當中。這類新研究的綜述涵蓋了醫療保健、流行病學、材料科學、基礎物理、量子計算、分子作用模擬、流體力學、臨床心理學、經濟學、視覺科學以及藥物發現等領域。
這些綜述突出了機器學習目前已經取得的重要成就和對后續可能取得成就的預測,多數文章也提到了智能機器的局限。 比如一些令人印象深刻的正確答案就來源于學習的“捷徑”而非真正的理解。
智能機器也因此顯然容易被誤導出錯。 而且, 如今大部分所謂的智能機器都局限在某一技能領域,高效應對特定的任務,而非具有人類普遍認知能力的靈活性。 比如一臺電腦可以在象棋比賽中戰勝大師,卻不會玩撲克。
計算機學家梅蘭妮·米歇爾在她的書《人工智能:人類思維指南》中寫道:“與人類對比明顯的是,當今大多數人工智能的‘學習’都不能在相關任務之間轉化。”
米歇爾解釋道,對人工智能進行真正的探索還有許多障礙——機器仍然不能像 (起碼一部分) 人類那樣對世界進行全局的思考和推理。
米歇爾說:“人們容易高估人工智能的先進性而又低估自身智力的復雜性。”對超級智能機器接管世界的恐懼是錯位的,她引用一位行為經濟學家的評論:“我們的確應該害怕,但不是害怕智能機器,而是對機器在自己智能無法了解的方向進行決定。 相比于機器的智能我更害怕機器的智障。 ”
一、機器學習進步迅速
實際上,計算機學家已經開發出了一些相當強大的算法來訓練機器學習。通常這些學習依托各種被稱為神經網絡的計算系統。這些神經網絡是粗略仿照人類大腦神經細胞的處理單元。在一個傳統的神經網絡中,一層人工神經通過接收的輸入信號來修改與另一層神經的關聯強度,從而將輸入信號識別傳輸給輸出層。于是人工神經網絡才能夠“學習”將輸入的信號認作一張貓的圖片。
在過去十年左右的時間里,主流的機器學習策略依賴于多層人工神經網絡,這種方法也被稱為深度學習。 一臺深度學習的機器可以在模式中識別不同模式,使輸入的分類更加精細,甚至超過專業人員的能力。一個訓練有素的深度學習系統甚至可以在CT掃描中識別出逃過放射科醫生眼睛的癌癥信號。
在某些系統中,機器學習是“受監督的”,這種情況下訓練機器所用的是標記的數據;而不受監督的學習則意味著訓練機器未被告知所輸入的大數據集的含義,電腦自己需要識別出分類或行為的模式。另外有一種叫做 強化學習 的方法, 如果機器能完成某個目標 (就像贏得某個游戲) ,那么在處理輸入時就會受到“獎賞” (比如在某個存儲文件中加分) 。 強化學習通過在圍棋比賽中幫助機器戰勝了人類從而展示了自己的威力。
機器學習雖然在圍棋上值得一個頭條,但是在醫藥、工業和科學等領域取得的實際成就則更令人矚目。
醫藥方面,機器學習幫助研究人員改進治療效果標準測試的弱點。 測試疾病治療效果的醫學試驗通常依賴于測試結果平均值來確定有效性,因此可能會錯過對少數患者有益的成分。比如,某個治療發現一個減肥項目不會減少糖尿病患者的心臟問題,但是根據傳染病學家維姆肯和計算機科學家凱利的報道,機器學習算法的確識別出了某一小部分患者在減重過程中心臟問題有所減少。
同時機器學習對于發現新藥的測試也幫助不少。“深度學習在藥物發現方法上具有廣泛的應用,”化學家朱浩在最近的藥理學和毒理學年度回顧文章中寫道,“在這個大數據時代中,最近深度學習所支持的人工智能的進展展現出了藥物發現領域巨大的前景。”
與發現新藥類似, 機器學習在發現工業應用的新材料方面也展現出了生產力:通過機器學習算法可以簡化尋找耐磨耐拉“超硬”材料的過程。 材料學家斯巴克斯撰寫的文章中評價道:“這個研究……是機器學習在發現新結構材料扮演重要角色的一個精彩的體現。”
二、比起機器智能,我更怕機器智障
除了受到廣泛關注的實際應用外, 機器學習也給基礎科學研究提供了便利。 在諸如大型強子對撞機 (LHC) 的高能粒子加速器中,質子相撞會產生包含其他亞原子粒子的復雜粒子流 (比如LHC于2012年發現的著名的希格斯玻色子) ,在每秒幾十億質子相撞幾百萬次的束流中,科學家需要從中明智地挑選出有價值的內容,這相當于在用消防高壓水槍喝水時決定吸入哪些分子,機器學習便可以幫忙在背景噪聲中分辨出有價值的事件。而其他機器算法可以幫助識別撞擊碎片中的粒子。
物理學家蓋斯特及同事說道:“深度學習已經影響了LHC的數據分析,并掀起了一股機器學習和粒子物理學界之間合作的新浪潮。”
量子物理學家卡利歐在另一篇文章中提到,機器學習的方法在數據處理方面的應用不只出現在粒子物理領域,還在宇宙學、量子計算等等其他基礎物理研究領域應用。
“隨著機器學習技術在工業應用中的興起,科學家們開始尋找機器學習在基礎研究中的潛力。”卡利歐和合作者在去年的一篇綜述中寫道。
三、學習的局限
就如卡利歐和其他綜述作者所強調的那樣, 機器學習也有缺陷,科學家不應當被其成就蒙蔽:
“對機器學習的潛能和局限性持有健康和批判性的態度,包括分析這些方法的突破點以及它們明顯不擅長的地方。”
一方面,一個機器的“智能”局限于它學習數據的性質。 例如,經過訓練的機器可以通過分析人類雇傭決定來篩選求職者,同時也會通過一些歷史歧視數據對特定人群產生各種偏見。
即使機器表現不錯,那也只是看上去比較聰明。例如,關于圖像識別的報告應該考慮到,機器的準確性通常是指其前五個“猜想”——五個當中如果任何一個識別正確,機器便會獲得嘉獎。
有時候看似智能的機器準確執行任務并非由于它像人類那樣理解,而是機器找出了一個獲得正確答案的捷徑。 “一個好像很容易地分辨出牛的深度神經網絡,可能無法認出一頭出現在草場場景以外的牛。”蓋里奧斯和合作者在最近的一篇預印本文章中寫道,在這個例子中“草場”變成了系統識別“牛”的捷徑。
有時機器又會以紋理而非形狀作為識別對象的捷徑,如果一只貓的圖片通過圖像處理軟件變成具有灰色陰影的浮雕圖像,就可能被機器識別成一頭大象。
這樣的捷徑可能就是機器容易被敵對的欺騙所愚弄的原因。
米歇爾在她的書中評論:“人類偷偷欺騙深度神經網絡令其犯錯出奇容易。”人眼會忽視的在醫學X光片上的一點點改變就可能將機器診斷的結果,從99%未患癌癥的置信變為99%存在癌癥的置信。
米歇爾認為,由于人類并不理解機器如何做決定,所以很難解釋這些失誤的出現。在多層深度學習的神經網絡中運算就像在一個黑匣子中運作,人類不能感知,也就難以確定深度學習的運行原理。
她還提到: “由于深度神經網絡做的決定往往難以理解,所以其失誤便很難預測和修復。”
無論機器到底如何學習,都和人類的方式不同。不只機器智能難以理解,人類智能也是如此。科學家只有更完整地理解人類智能,才能研究出更強大的人工智能替代品。所以我們也不必太過擔心戴塔的兄弟洛爾會很快統治人類。
米歇爾分享了軟件企業家卡普爾說的觀點:“人類智能是一種絕妙、微妙而且探索甚少的現象,目前還沒有任何復制它的危險。”而甚至到24世紀可能也是如此。
原文鏈接: Why some AI?is?smart until?it's?dumb
本文來自微信公眾號: 中科院物理所 (ID:cas-iop) ,作者:Tom?Siegfried,翻譯:zhenni,編輯:藏癡