如何看待 Kaggle 被 Google 收購?
在 Google Cloud Next 谷歌云計算開發者大會上,華人 AI 學界的驕傲、谷歌云首席科學家李飛飛宣布了一則重大消息:谷歌收購 Kaggle。
谷歌收購數據科學公司Kaggle 增強機器學習和AI業務
其實,關于這事兒,近兩天陸續有風聲傳出。但谷歌和 Kaggle 對各路媒體總是一副 “無可奉告” 的態度,導致大家各自猜測,但無從證實。即便是李飛飛在 Next 大會上對全世界進行宣布,也僅僅停留在 “沒錯,我們是收購了 Kaggle,這事兒對雙方都有好處” 的層面;對收購細節、未來計劃等信息一概無涉,更不要提收購協議和價格。
但是,Google+Kaggle,即便不進行任何發酵,也是震動數據科學、AI、機器學習三界(好吧,在很多方面 “三界” 本是一體)的大事件。其衍生出來的潛藏信息:對開發者社區的意義、行業走向,以及谷歌的機器學習布局等——雖然當事者惜字如金,卻為嗅覺敏銳的觀察者帶來巨大的想象空間。這隱約使人聯想起 2014 年谷歌對 DeepMind 的收購:雖則后者與 Kaggle 不管在業務、還是運營方式上都完全不同,但 Kaggle 所掌握的行業資源,只在 DeepMind 之上;兩次收購對于谷歌的意義,同樣位于極高的戰略層面。
下面我們來整理一遍,關于此次收購迄今為止披露的所有信息。
Kaggle 簡介
凡是玩數據科學和機器學習的老司機,有兩個網站一定不會錯過:GitHub 和 Kaggle。前者用來分享,后者進行實戰練習。對于不熟悉 Kaggle 的童鞋,我們先來進行一段簡介。
簡而言之,Kaggle 是玩數據、ML 的開發者們展示功力、揚名立萬的江湖。
它在 2010 創立,專注于舉辦數據科學周邊的線上競賽。它吸引了大量數據科學家、機器學習開發者的參與,為各類現實中的商業難題開發基于數據的算法解決方案。競賽的獲勝者、領先者,在收獲對方公司提供的優厚報酬之外,還將引起業內科技巨頭的注意,獲得各路 HR 青睞,為自己的職業道路鋪上紅地毯。
因此,與 GitHub 不同的地方在于,Kaggle 為其社區提供了一整套服務。其中最有名的是它的招聘服務以及名為 Kaggle Kernels 的代碼分享工具。
或許因為如此,Kaggle 社區在圈內極受歡迎:用戶基數大、粘性強。通常認為 Kaggle 平臺有幾十萬數據科學家。至于具體多少,有媒體認為是五十萬,有人說八十萬(李飛飛),還有人說超過一百萬。
總而言之, Kaggle 是當今最大的數據科學家、機器學習開發者社區,其行業地位獨一無二。
而大約一年前,Kaggle 開始全力在 AI、機器學習領域發力,相關競賽項目紛紛上馬。李飛飛評論道:
“Kaggle 是搜尋、分析公共數據集,開發機器學習模型,和提高數據科學專業水平的最佳場所。”
“AI 民主化” 的使命
在大會上,李飛飛發表了主題為 “讓 AI 民主化” 的演講。在此次演講和之后撰寫的博文里,她對谷歌收購 Kaggle 的意圖給出了官方版本的解釋:
“我強調 AI 民主化的重要性——我們必須降低進入 AI 領域的門檻,讓 AI 技術能為盡可能多的開發者社群、用戶和企業所用,讓 AI 被用于解決他們各自的問題和需求。Kaggle 加入谷歌,能加速這一進程。”
冠冕一些來講,推動 AI 技術的分享和推廣,是谷歌收購 Kaggle 背后的 “mission”,即使命。
加入谷歌之后的 Kaggle
雖然谷歌對收購協議的內容進行保密,我們仍能從雙方已透露的信息看出一些端倪。比如,有一件事是確定無疑的 :Kaggle 將保留獨立品牌和團隊。
Kaggle 創始人 Anthony Goldbloom 也在昨晚發表博文,回顧 Kaggle 創立以來取得的成績,對支持 Kaggle 社區的開發者表示感謝,并透露了一些將來的計劃:
“ Kaggle 團隊仍會是一個整體,并將作為谷歌云旗下的獨立品牌運營。我們會繼續擴展 Kaggle 上的競賽和開源數據平臺;并且我們會繼續對所有的數據科學家、公司、和技術敞開懷抱。Kaggle Kernels 會繼續對各類機器學習庫和工具包組成的多樣生態進行支持,不管其是否來自谷歌。
加入谷歌能讓我們實現更多。此次收購,把世界上最大的數據科學社區與最先進的機器學習云結合到了一起。
加入谷歌后,我們能夠向社區提供谷歌云技術。這將使大家能利用更強大的基礎設施和部署服務(deployment services),進行可擴展的訓練,并且幫助 Kaggle 擁有存儲、獲取大型數據集的能力。”
李飛飛在大會和博客上的表態,雖沒有 Anthony Goldbloom 詳細,但也印證了一些 Anthony Goldbloom 提到的要點。比如,飛飛老師說谷歌云將為 Kaggle 社區成員提供云機器學習開發環境,Kaggle 和谷歌云將繼續支持訓練和部署服務,并幫助社區存儲、獲取大型數據集。
結合飛飛老師對 “AI 民主化” 的表態,以及在大會上回溯她親手創建的 ImageNet、對數據庫重要性進行的強調;我們認為,我們應當可以期待谷歌云在數據上為 Kaggle 提供強力支持,幫助 Kaggle 社區的開發者獲取更多、更有價值的數據集。而這確實擊中了數據科學家和機器學習開發者的一大痛點。這無疑也將直接提升谷歌對數據科學、機器學習社區的影響力,以及在其中的口碑和品牌認同。
收購 Kaggle 之后的谷歌
谷歌的核心業務與 AI 緊密相關,也已經成為推動這一輪 AI 技術浪潮的主要玩家之一。AI、數據科學和機器學習對于谷歌的戰略意義,已毋庸贅言。自從去年 AlphaGo 與李世石的世紀之戰,谷歌的江湖聲望更是如日中天。
但是,在 AI 應用和技術的各個垂直領域,如自動駕駛、語音識別、深度學習等,谷歌很可能已經感覺到壓力。眾所周知,谷歌 Waymo 自動駕駛業務并不是一帆風順。在語音識別領域,微軟和 IBM 屢創紀錄。深度學習領域,Facebook AI 實驗室 FAIR,以及 OpenAI 都在生成對抗網絡 “GAN” 這一前沿技術上投入巨大,產出豐厚研究成果。業內人士對于谷歌在 AI 技術上 “領先” 于其它對手的印象,已經不再那么牢固(如果此前稱得上 “牢固” 的話)。
想要維持 “老大哥” 地位,就要進一步投入。而有一個領域是谷歌遠遠甩開對手的:沒錯,我說的是 Tensorflow。在深度學習開源工具上,Tensorflow 的市場占有率遠遠超出其他任何框架、平臺。因此, 對于開發者這一群體,谷歌的影響力具有天然優勢。而收購 Kaggle 則將這一優勢無限擴大。
當然,我們不要忘記,Kaggle 加入的部門是谷歌云。與競爭對手亞馬遜 AWS、微軟 Asure 相比,谷歌云的地位一直十分尷尬,市場占有率遠遠落后于前兩者。此次的 Google Cloud Next 大會,重點其實是宣傳谷歌在云計算上的巨大投入和決心。而細看谷歌對于此次收購的官方表態,也不乏對谷歌云將來能為 Kaggle 所提供的各種支持的強調。 谷歌或許希望 Kaggle 能成為谷歌云業務的一項突破口,比如借 Kaggle 平臺讓開發者體驗谷歌云、為后者做宣傳 。至于其它玩法,現在不得而知,尚待將來觀察。
另外,外媒紛紛猜測,收購 Kaggle 可使谷歌在雇傭尖端開發人才上獲得便利。這是一個十分合情合理的推測。
周邊
谷歌與 Kaggle 的合作已經開始
上個月(2 月 16 日),Kaggle 與谷歌聯合舉辦了 Google Cloud & YouTube-8M Video Understanding Challenge。這是迄今為止世界最大規模的視頻理解挑戰賽。該挑戰要求機器學習開發者,尋找出自動標記 Youtube 視頻的方法。
澳大利亞媒體的哀嘆:“谷歌買走了我們的 Kaggle!”
據了解,Anthony Goldbloom 是墨爾本大學畢業生。他于 2010 年在悉尼創辦 Kaggle ,但在 2011 年將公司總部遷去了舊金山,這次更是直接被美國企業收購。不出意料,對這次谷歌收購 Kaggle 報道最積極的當屬澳大利亞媒體。這再次讓小編聯想起 DeepMind——以及它被收購后英國 AI 圈的反應。
via:雷鋒網
End.
轉載請注明來自36大數據(36dsj.com): 36大數據 ? 如何看待 Kaggle 被 Google 收購?