一個里程碑:谷歌實現視頻內容識別,并探討AI民主化

在當地時間3月8日的Google Cloud NEXT ’17 大會上的Keynote演講中,谷歌云機器學習與人工智能首席科學家李飛飛代表谷歌發布了多個谷歌云API產品,并正式宣布了谷歌云對數據科學社區Kaggle的收購。
一個里程碑:谷歌實現視頻內容識別
根據 the Verge的報道 ,李飛飛現場演示了一個叫視頻智能(Video Intelligence)的API,該API支持自動識別視頻中的物體和內容,使它們變得可搜索。李飛飛表示,通過視頻識別技術,“我們將開始給數字星空中一個黑暗的物質照亮光芒。”
有了該API的幫助,開發者將能夠開發出支持搜索和發現視頻中的信息的應用程序。不僅如此,它還能幫助標記視頻中的場景變化。
如果不出意外,谷歌是公開報道中首個實現視頻內容識別的企業,這也是人工智能的一個里程碑。說句不專業的話,國內的百度、阿里、騰訊、科大訊飛、搜狗們又被甩出幾條街了。
李飛飛表示:“像素的世界已經延伸到圖像以外。視頻對于機器學習研究人員來說一直以來都是個挑戰。但現在的該項新服務能夠使得從視頻中提取信息變得跟從圖像中提取信息一樣簡單。”
谷歌人工智能應用進展
而根據 機器之心在現場的報道 ,李飛飛還通過一些具體案例較少了谷歌人工智能的應用進展:
零售:機器學習算法在幫助谷歌的 AdSense為消費者提供更合適的建議,但也仍還有進步的空間,比如供應鏈優化、隨時間預測需求改變以及使用無人機或無人車為消費者快遞貨物等等。
媒體娛樂:比如Google Photos的自動照片標注和YouTube的推薦播放列表。虛擬現實和增強現實依賴計算機視覺來進行運動追蹤、環境監測和游戲。甚至新聞報道也將可以自動生成。人工智能將能幫助我們創造更加個性化的內容,比如音樂、視頻和藝術品。
金融:機器學習正在信用卡風險檢測、反詐騙和洗錢等方面發揮越來越大的作用。
醫療保健:人工智能正在真正改善著人們的生活,比如布滿傳感器的智能化醫院、增強診斷等。幾個月前,谷歌大腦的研究者表明可以使用深度學習來幫助診斷糖尿病性視網膜炎。
AI民主化
除此之外,李飛飛認為, 人工智能的下一步將是“AI民主化”,包括民主化計算、民主化算法、民主化數據和民主化人才四個方面。
民主化計算
李飛飛說:“去年,我們推出了Beta版的 Cloud ML Engine,今天我在這里宣布其已經實現了更廣泛的可用性。Cloud ML Engine 是一個能夠利用谷歌所有計算資源的平臺。”
根據介紹,有了ML Engine后,用戶可以使用其熟悉的TensorFlow庫,把精力放在自身創意和解決方案上,谷歌云則會為用戶處理基礎架構和模型上的問題——用戶將它們上傳至谷歌云,ML Engine 能更快速地進行大規模處理,并將其部署在移動設備上。
民主化算法
李飛飛宣布了一項新產品——Vision API。她介紹道,正在穩步研發的 Vision API 具備一些非常重要的新能力。第一,谷歌把該 API 的元數據(metadata)擴展到了識別來自谷歌圖像的知識圖譜的數百萬實體;第二,增強了光學字符識別(OCR)功能,能夠從富含文本的圖像中提取出文本,比如法律文件等。
民主化數據
李飛飛認為數據是民主化的另一部分,像人類一樣,人工智能需要大量數據為自我發展提供洞見。因此,數據集是人工智能需要克服的最大障礙中的一個。為了實現谷歌云實現數據民主化,李飛飛在大會上宣布谷歌受夠了數據科學社區Kaggle,后者聚集了超過85萬數據科學家,還曾與谷歌云共同舉辦過YouTube 8M視頻理解挑戰賽。
“收購 Kaggle 之后,谷歌云將為這個龐大社區提供最先進的機器學習環境,并提供直接市場化模型的機會。”李飛飛表示。
人才民主化
谷歌云發布了Advanced Solution Lab,實現其他公司與谷歌的人才合作,以幫助他們解決復雜的機器學習問題。
AI民主化概念此前鮮有科技公司提及,谷歌率先確定AI民主化將是人工智能的下一步,無疑又一次領先了世界。不過國內的企業也在迎頭趕上,比如每年秋天的云棲大會就是阿里巴巴展示阿里云的最佳場所,不過跟谷歌不同,阿里的云棲大會更像是尋找商業伙伴,而谷歌云計算大會更像是前沿技術探索。
? ?