谷歌發(fā)布首份“開源成績單”,盤點(diǎn)最受歡迎 8 大深度學(xué)習(xí)項(xiàng)目
1 新智元編譯 1
譯者:劉小芹
【重要通知:10月18 日世界人工智能大會(huì)現(xiàn)場一律憑活動(dòng)行二維碼入場, 上午主論壇于 08:30 正式開始 ,現(xiàn)場座位緊張,請?zhí)崆昂灥饺雸觥A硗猓? 不接受現(xiàn)金購票,分論壇票只有下午可以入場】 2016 世界人工智能大會(huì) 活動(dòng)行瀏覽已經(jīng)超過 7 萬,還有一些已購票付款的公司和機(jī)構(gòu)未換二維碼。活動(dòng)行在大會(huì)現(xiàn)場設(shè)有咨詢席位,但提前換二維碼節(jié)省簽到時(shí)間。請團(tuán)購注冊的公司關(guān)注,務(wù)必提醒參會(huì)的同事們手機(jī)接收二維碼,如果不清晰可以打印出來,現(xiàn)場在簽到處換領(lǐng)大會(huì)嘉賓胸卡。
大會(huì)地點(diǎn):國家會(huì)議中心( C4 入口)
會(huì)議簽到:上午主論壇 07:30-08:30,下午分論壇 13:00-14:00
會(huì)議時(shí)間:上午主論壇 08:30- 12:00 ,下午分論壇 14:00-18:00
【關(guān)注世界人工智能大會(huì)的好友們,福利來了!】 愛奇藝科技頻道提供周二上午主論壇的直播( H5地址,各端都可以看 ): http://www.iqiyi.com/l_19rr7t1kdn.html
無法親臨現(xiàn)場的好友們歡迎收藏!
【新智元導(dǎo)讀】 開源“大戶”谷歌在2016年都有哪些表現(xiàn)?這10個(gè)項(xiàng)目最受歡迎。你認(rèn)為 TensorFlow 排第幾?
Google近日公布了首份“開源成績單”(Open Source Report Card),介紹了他們最受歡迎的開源項(xiàng)目,并分享了Google工程師們最喜歡的編程語言。
Google開源 項(xiàng)目辦公室主管Josh Simmons 在博客中寫道:開源讓Google能夠更快速、高效地創(chuàng)造新事物,而無需重新發(fā)明輪子,使我們能夠?qū)W⒂诮鉀Q新問題。我們知道,我們是站在巨人的肩膀上。這就是我們支持開源,并且致力于讓Google工程師們更方便地開源他們正在進(jìn)行的項(xiàng)目的原因。
Google已經(jīng)開源了900多個(gè)項(xiàng)目,超過2000萬行代碼(所有開源項(xiàng)目地址:https://github.com/google)。Google有許多工程師全職工作于開源項(xiàng)目,更多工程師甚至利用他們20%的時(shí)間創(chuàng)建新項(xiàng)目或者貢獻(xiàn)他們喜歡的現(xiàn)有項(xiàng)目。
谷歌最受歡迎的十大開源項(xiàng)目
這份開源成績單分享了Google的開源項(xiàng)目中最受歡迎的10個(gè)項(xiàng)目:
-
Android ? 用于移動(dòng)設(shè)備的軟件棧,包括操作系統(tǒng)、中間件和關(guān)鍵應(yīng)用。
-
Chromium ? 包括Google Chrome瀏覽器背后的軟件Chromium,以及Google Chrome OS設(shè)備背后的Chromium操作系統(tǒng)。
-
Angular ? Java和Dart的Web應(yīng)用框架,專注于提高開發(fā)人員的生產(chǎn)力,使開發(fā)和測試更容易。
-
TensorFlow ? 使用數(shù)據(jù)流圖進(jìn)行數(shù)值計(jì)算的庫,支持從數(shù)據(jù)中心到嵌入式設(shè)備的跨平臺機(jī)器學(xué)習(xí)。
-
Go ? 一種靜態(tài)強(qiáng)類型、編譯型的編程語言,具有表達(dá)性、簡潔、干凈、高效的特點(diǎn)。
-
Kubernetes ? 用于容器集的自動(dòng)化部署、操作和縮放的系統(tǒng)。
-
Polymer ? 基于Web組件API構(gòu)建的輕量級庫,用于在Web應(yīng)用程序中構(gòu)建封裝的可重復(fù)利用元素。
-
Protobuf ? 一個(gè)可擴(kuò)展、語言中立以及平臺中立的框架,用于結(jié)構(gòu)化數(shù)據(jù)的序列化。
-
Guava ? 包括新的集合類型(例如多圖和多集)、不可變集合、圖形庫、功能類型, 內(nèi)存cache 、協(xié)同API、I/O、哈希、字符串處理等的一系列Java核心庫。
-
Yeoman ? 一套強(qiáng)大的腳手架工具,包括庫和工作流,可以幫助開發(fā)者快速構(gòu)建漂亮的Web應(yīng)用程序。
谷歌工程師最常用的語言TOP10
Google工程師們使用的編程語言非常多樣,從Assembly到XSLT都有,那么他們最喜歡的編程語言是什么呢?通過統(tǒng)計(jì)GitHub上的星標(biāo)數(shù)量,Google公布了他們的工程師最喜歡的十種編程語言:
-
Java
-
C/C++
-
Go
-
Python
-
Type
-
Dart
-
PHP
-
Objective-C
-
C#
谷歌八大深度學(xué)習(xí)開源項(xiàng)目
1. Google第二代深度學(xué)習(xí)引擎TensorFlow開源
2015年11月,谷歌開源深度學(xué)習(xí)平臺 TensorFlow。2016年4月,谷歌推出了分布式 TensorFlow。現(xiàn)在,TensorFlow 已經(jīng)成為最受歡迎的深度學(xué)習(xí)平臺之一。
2. 谷歌開源全球最精準(zhǔn)語言解析器SnytaxNet
2016年5月13日,Google Research宣布,世界準(zhǔn)確度最高的自然語言解析器 SyntaxNet 開源。谷歌開源再進(jìn)一步。據(jù)介紹,谷歌在該平臺上訓(xùn)練的模型的語言理解準(zhǔn)確率超過90%。 SyntaxNet 是一個(gè)在TensoFlow中運(yùn)行的開源神經(jīng)網(wǎng)絡(luò)框架,提供自然語言理解系統(tǒng)基礎(chǔ)。谷歌公開了所有用用戶自己的數(shù)據(jù)訓(xùn)練新SyntaxNet模型所需要的代碼,以及 谷歌已經(jīng)訓(xùn)練好的,可用于分析英語文本的模型 Paesey McParseface。
Paesey McParseface 建立于強(qiáng)大的機(jī)器學(xué)習(xí)算法,可以學(xué)會(huì)分析句子的語言結(jié)構(gòu),能解釋特定句子中每一個(gè)詞的功能。此類模型中,Paesey McParseface是世界上最精確的,谷歌希望它能幫助對自動(dòng)提取信息、翻譯和其他自然語言理解(NLU)中的應(yīng)用感興趣的研究者和開發(fā)者。
3. 谷歌推出 Deep&Wide Learning,開源深度學(xué)習(xí) API
2016年 6月29日,谷歌研究所推出 Wide & Deep Learning,并將 TensorFlow API 開源,歡迎開發(fā)者使用這款最新的工具。同時(shí)開源的還有對 Wide & Deep Learning 的實(shí)現(xiàn),作為 TF.Learn 應(yīng)用程序接口的一部分,讓開發(fā)者也能自己訓(xùn)練模型。
4. 谷歌開源圖像分類工具TF-Slim,定義TensorFlow 復(fù)雜模型
2016年 8月31日,谷歌宣布開源 TensorFlow 高級軟件包 TF-Slim,能使用戶快速準(zhǔn)確地定義復(fù)雜模型,尤其是圖像分類任務(wù)。自發(fā)布以來,TF-Slim 已經(jīng)得到長足發(fā)展,無論是網(wǎng)絡(luò)層、代價(jià)函數(shù),還是評估標(biāo)準(zhǔn),都增加了很多類型,訓(xùn)練和評估模型也有了很多便利的常規(guī)操作手段。這些手段使你在并行讀取數(shù)據(jù)或者在多臺機(jī)器上部署模型等大規(guī)模運(yùn)行時(shí),不必為細(xì)節(jié)操心。此外,我們還制作了 TF-Slim 圖像模型庫,為很多廣泛使用的圖像分類模型提供了定義以及訓(xùn)練腳本,這些都是使用標(biāo)準(zhǔn)的數(shù)據(jù)庫寫就的。TF-Slim 及其組成部分都已經(jīng)在谷歌內(nèi)部得到廣泛的使用,很多升級也都整合進(jìn)了 tf.contrib.slim.
5. 谷歌開源大規(guī)模數(shù)據(jù)庫,10億+數(shù)據(jù),探索 RNN 極限
2016年 9月13日,谷歌宣布開源大規(guī)模語言建模模型庫,這項(xiàng)名為“探索RNN極限”的研究今年2月發(fā)表時(shí)就引發(fā)激論,如今姍姍來遲的開源更加引人矚目。研究測試取得了極好的成績,另外開源的數(shù)據(jù)庫含有大約 10 億英語單詞,詞匯有 80 萬,大部分是新聞數(shù)據(jù)。這是典型的產(chǎn)業(yè)研究,只有在谷歌這樣的大公司才做得出來。這次開源也應(yīng)該會(huì)像作者希望的那樣,在機(jī)器翻譯、語音識別等領(lǐng)域起到推進(jìn)作用。
6. 谷歌開源 TensorFlow 圖說生成模型,可真正理解圖像
2016年 9月23日,谷歌宣布開源圖說生成系統(tǒng) Show and Tell 最新版在 TensorFlow 上的模型。該系統(tǒng)采用編碼器-解碼器神經(jīng)網(wǎng)絡(luò)架構(gòu) ,分類準(zhǔn)確率達(dá) 93.9%,在遇到全新的場景時(shí)能夠生成準(zhǔn)確的新圖說。谷歌表示,這說明該系統(tǒng)能夠真正理解圖像。
7. 谷歌開源超大數(shù)據(jù)庫,含800萬視頻
2016年 9月28日,谷歌在官方博客上宣布,將含有800萬個(gè)Youtube 視頻URL 的視頻數(shù)據(jù)庫開源,視頻總時(shí)長達(dá)到了50萬個(gè)小時(shí)。一并發(fā)布的還有從包含了4800個(gè)知識圖譜分類數(shù)據(jù)集中提取的視頻級別標(biāo)簽。 這一數(shù)據(jù)庫在規(guī)模和覆蓋的種類上都比現(xiàn)有的視頻數(shù)據(jù)庫有顯著提升。例如,較為著名的Sports-1M數(shù)據(jù)庫,就只由100萬個(gè)Youtube 視頻和500個(gè)運(yùn)動(dòng)類目。谷歌官方博客上說,在視頻的數(shù)量和種類上,Youtube-8M代表的是幾乎指數(shù)級的增長。
8. 谷歌發(fā)布 Open Images 圖片數(shù)據(jù)集,包含900萬標(biāo)注圖片
2016年10月1日,繼前天發(fā)布800萬視頻數(shù)據(jù)集之后,今天,谷歌又發(fā)布了圖片數(shù)據(jù)庫Open Images,包含了900萬標(biāo)注數(shù)據(jù),標(biāo)簽種類超過6000種。谷歌在官方博客中寫到,這比只擁有1000個(gè)分類的ImageNet 更加貼近實(shí)際生活。對于想要從零開始訓(xùn)練計(jì)算機(jī)視覺模型的人來說,這些數(shù)據(jù)遠(yuǎn)遠(yuǎn)足夠了。
豪華嘉賓陣容,共饗 AI 盛宴
7 大院長齊聚新智元智庫院長圓桌論壇
2016世界人工智能大會(huì)技術(shù)論壇特設(shè)“新智元智庫院長圓桌會(huì)議”,重量級研究院院長8仙過海,帶來最前沿的AI研究動(dòng)態(tài)、剖析技術(shù)發(fā)展趨勢。
八位人工智能界“高手”現(xiàn)場過招,思想的激烈碰撞會(huì)給目前的人工智能發(fā)展帶來哪些洞見?八位院長對行業(yè)的發(fā)展會(huì)有哪些前瞻揭秘?10月18日下午,2016 世界人工智能大會(huì)技術(shù)論壇,答案將逐層揭曉。
新智元智庫院長圓桌匯集了中國人工智能產(chǎn)學(xué)研三界最豪華院長陣容:美團(tuán)技術(shù)學(xué)院院長劉江擔(dān)任主持人,微軟亞洲工程院院長劉震、IBM中國研究院副院長邵凌、360人工智能研究院院長顏水成、北京理工大學(xué)計(jì)算機(jī)學(xué)院副院長黃華、Intel 中國研究院院長宋繼強(qiáng)、新華網(wǎng)融媒體未來研究院院長楊溟聯(lián)袂出席。
2016世界人工智能大會(huì)技術(shù)論壇議程
掃描二維碼購票:
購票鏈接:http://www.huodongxing.com/go/aiworld2016
也可點(diǎn)擊‘閱讀原文’直接購票
票務(wù)聯(lián)系 132·4023·6748