外媒:百度玩不轉移動互聯網,轉而全力押注人工智能
【AI世代編者按】外媒近日刊文稱,移動互聯網時代鮮有建樹的 百度 已經將目光投向了人工智能,甚至開始全力押注這項技術,希望提前卡位新一輪科技趨勢。
以下為AI世代(微信號:tencentAI)編譯整理的原文內容:
2016年12月6日,成千上萬名翻譯在中國各地的辦公樓里注視著用外語寫成的宣傳冊、信件和技術手冊,煞費苦心地將其翻譯成中文。這場馬拉松每天進行15小時,總共持續一個月時間。
提供材料的客戶將以低價獲得專業級別的中文譯文。但作為這場大型翻譯活動的組織者,百度看重的卻是更有價值的東西:他們希望用數以百萬的英漢詞對來訓練其在線翻譯引擎。
中國向來以“山寨大國”著稱,無論是名牌手包還是互聯網創業公司都概莫能外。但該國領導人似乎意識到,在人工智能領域,成本低廉的模仿策略已經無法奏效——尤其是在面對Alphabet、 Facebook 、 IBM 和 微軟 這樣的競爭對手時。
今年2月,國家發改委指定百度領導成立一個新的人工智能實驗室,表明中國政府認為該公司是這一領域的領頭羊。
百度聯合創始人兼CEO 李彥宏 在這個實驗室上月舉行的成立儀式上表示,百度過去兩年半的研發開支達到200億元人民幣(29億美元),多數都投向了人工智能領域。但他發展這項技術的主要動機并不是為了迎合政府:百度去年營收增速萎縮到6%左右,而之前3年平均每年都增長30%以上。
在截至12月31日的財年內,百度實現銷售額705億元人民幣,作為其中的重要來源,搜索廣告業務正在面臨本土競爭對手的圍攻。美國市場研究公司eMarketer今年9月發布報告稱, 阿里巴巴集團 已經超過百度,成為中國數字廣告市場的領導者。百度希望人工智能可以幫助其重新增加搜索份額,同時確保新業務取得成功。
由于這家成立至今17年的公司在實施多元化的過程中喜憂參半,所以此次嘗試顯得格外重要。中金分析師納塔利·吳(Natalie Wu)預計,在截至2017年2月的12個月內,百度旗下團購網站糯米的日用戶訪問量下滑59%。百度外賣也僅位居行業第三。
該公司旗下的視頻網站愛奇藝雖然廣受歡迎,但華興資本分析師艾拉·季(Ella Ji)預計其今年的內容費用高達120億元人民幣。
正是因為有過這些失敗的經歷,因此百度進軍人工智能領域被賦予更重要的意義。“移動互聯網時代已經結束。”李彥宏在3月10日接受采訪時說,“我們會大舉投資人工智能,我們認為這會讓很多人獲益,還將改變很多行業。”
今年1月,該公司任命微軟高管陸奇為COO,負責圍繞深度學習、增強現實和圖像識別等技術重塑該公司。在此之前,該公司還挖來了斯坦福大學學者、Alphabet深度學習部門前負責人吳恩達擔任首席科學家。
在吳恩達的領導下,百度的人工智能團隊已經擴大到1300人,分布在北京、深圳、上海和加州桑尼韋爾的多個實驗室。他們今年還有望再招聘幾百人。“有很多人在中國搞發明,還有很多人在美國搞發明。”吳恩達說,“在兩個國家都有人,我們就能看清最新趨勢。”
吳恩達
2014年5月,就在桑尼韋爾研發中心開張的當天,吳恩達和他的副手亞當·考特斯(Adam Coates)坐在一塊白板前,確定他們的第一個項目。在規劃了一系列可能性(和挑戰)之后,他們將語音識別確定為一大基礎,認為可以基于此開發一系列產品。
到2015年中,這個由50人組成的團隊推出了一款名為Deep Speech的產品,可以分辨出許多英語語音。這款軟件并非挨個單詞進行識別,而是通過理解大量的語言數據來推測某種形態——這一過程被稱作深度學習。
吳恩達表示,由于考慮了文字背景來判斷其含義,該系統的識別準確率高于依靠詞匯表和語音詞典的傳統引擎。
但始終難以克服的是隨著時間推移從其他從語言引入英語的詞匯和姓名。“如果你說‘Play music by Tchaikovsky’(放一首柴可夫斯基的音樂),軟件會理解成‘Play music and try cough ski’。”從斯坦福大學跳槽來的考特斯說,“我們將此稱作‘柴可夫斯基問題’。”
百度的程序員沒有簡單地把“Tchaikovsky”加入系統的詞匯表,而是幫助Deep Speech通過自學來理解這個詞。這就需要通過更多數據幫助系統理解上下文。
百度自然語言處理部門副主任趙世奇回憶道,當他在哈爾濱工業大學讀書時,計算機翻譯還只有200萬個英漢詞對,百度目前約有1億個。然而,根據2016年發表在《 科學 》雜志上的論文,這仍然遠低于Alphabet的5億個。
為了縮小這一差距,百度采取了“人海戰術”的老辦法。該公司現在一年到頭都會為人工翻譯提供幫助,還會定期舉行去年12月那樣的馬拉動活動,并為客戶提供智能手機和凈水器等獎品。他們會借助這一過程中的數據來提升百度翻譯引擎的表現,同時進一步促進Deep Speech的發展。
桑尼韋爾團隊在2016年7月發布了自己的軟件TalkType,這是一款帶有語音輸入功能的鍵盤。這項技術此后又整合到其他功能中,包括一款類似于Siri的個人助手——度秘。通過在Deep Speech中整合機器學習技術,便可為其他產品賦予智能,包括今年1月在拉斯維加斯國際消費電子展( CES )上展示的的小魚在家語音控制機器人。
借助多樣化的網絡業務,百度掌握了中國規模最大、最詳細的消費者數據庫之一。這應該為其開發人工智能產品和服務帶來優勢——至少理論上如此。
通過糯米和百度外賣,該公司可以了解中國家庭的購買和就餐習慣,而攜程則可以幫助其了解消費者的休假目的地。每個月都有6.65億智能手機用戶訪問該公司的移動門戶和應用,還有3.41億使用百度地圖搜索目的地。“把人工智能當成一款產品是一種錯誤觀念——它是一種底層技術,可以催生其他產品。”匯豐銀行分析師Chi Tsang說,“可以設想各種用例。”
新的人工智能產品并沒有為百度的業績做出太大貢獻。但該公司在這一領域的技能卻可以幫助其主導已經涉足的領域,并推動其進軍云計算和無人駕駛汽車等新領域。
“未來3至5年,這些領域都有望成為另一個百度。”百度總裁 張亞勤 ( 微博 )說,他指的是百度602億美元的市值。“現在該下注了。”(編譯/長歌)
推薦:人工智能洶涌而來,未來已變!關注“AI世代”微信號(tencentAI),關注未來。