英偉達發(fā)布十多年來最重要創(chuàng)新圖靈架構(gòu),全球首批即時光線追蹤GPU同步亮相
雷鋒網(wǎng) (公眾號:雷鋒網(wǎng)) 消息,英偉達CEO黃仁勛(Jensen Huang)在今日的SIGGRAPH 2018上正式發(fā)布了此前已被曝光的新一代GPU架構(gòu)——Turing(圖靈)。同時,一系列基于圖靈架構(gòu)的GPU包括Quadro RTX 8000、Quadro RTX 6000、Quadro RTX 5000以及Quadro RTX Server、CUDA10也共同亮相。
黃仁勛表示:“圖靈架構(gòu)是自2006年CUDA GPU發(fā)明以來最大的飛躍,Quadro RTX系列也是全球首批支持即時光線追蹤(Real Time Ray Tracing)的GPU?!?/p>
圖靈(Turing)架構(gòu)
黃仁勛將圖靈架構(gòu)描述為英偉達十多年來在計算機圖形領(lǐng)域最重要的創(chuàng)新,這是一個很明確的標準。圖靈架構(gòu)是英偉達的第八代GPU架構(gòu),使全球首款光線追蹤GPU成為可能,也是超過一萬個工程年的努力成果。 圖靈架構(gòu)承載了RT核心(RT Core)以及全新張量核心(Tensor Core)。
RT核心專門用于實時光線追蹤的處理器,能對光線和聲音在3D環(huán)境中的傳播進行加速計算,據(jù)稱它的實時光線追蹤能力提升到了Pascal架構(gòu)的25倍。張量核心是為深度學習訓練和推斷加速的處理器,支持每秒500萬億次張量運算。這些新功能包括DLAA(深度學習抗鋸齒),以及去噪、分辨率縮放和視頻調(diào)速。這些特性是NVIDIA NGX 軟件開發(fā)套件的一部分,這種全新深度學習技術(shù)堆棧可助力開發(fā)者通過預(yù)先訓練的網(wǎng)絡(luò),輕松地在應(yīng)用中集成加速且增強的圖形、照片成像和視頻處理。
英偉達承若圖靈架構(gòu)GPU模擬物理世界的能力將比Pascal架構(gòu)提升6倍。
需要補充的是, RTX光線追蹤技術(shù)(Ray-Tracing) 是英偉達在3月發(fā)布新技術(shù),這項新技術(shù)能夠計算光線反射、折射、散射等路線,渲染出逼真的畫面,可為游戲開發(fā)者提供電影級畫質(zhì)的實時渲染。更具體的來說,就是在真實世界中,我們看到的3D物體被光源照亮,且光子可以在到達觀看者的眼睛以前從一個物體反彈到另一個物體。光線追蹤技術(shù)則反過來,通過從觀者眼睛(觀景式照相機)反向追蹤光線捕捉這些效果,通過追蹤2D視表面上每個像素的光線的路徑,并應(yīng)用到場景的3D模型中。
實時光線追蹤技術(shù)過去只在影視作品的CG制作中出現(xiàn),一般是用幾天時間,渲染出幾幀動畫,這個動畫的陰影、金屬和水面的折射以及反射等都很逼真。
全球首批即時光線追蹤GPU——Quadro RTX
黃仁勛在SIGGRAPH 2018上同時帶來了全球首批支持即時光線追蹤的GPU——Quadro RTX系列。Quadro是英偉達的專業(yè)級顯卡,主要面向設(shè)計、特效、科學可視化等視覺計算任務(wù)。
基于圖靈架構(gòu)的GPU采用了流式多處理器(SM)架構(gòu),該架構(gòu)新增了與浮點數(shù)據(jù)路徑并行執(zhí)行的整數(shù)執(zhí)行單元,以及帶寬為早前架構(gòu)兩倍的全新統(tǒng)一緩存架構(gòu)。結(jié)合可變速率著色等全新圖形技術(shù),圖靈流式多處理器架構(gòu)實現(xiàn)了前所未有的單核性能水平。
新發(fā)布的Quadro RTX包括三款產(chǎn)品,分別是Quadro RTX 8000、Quadro RTX 6000、Quadro RTX 5000,具有16T單精度浮點性能,每秒10G GigaRays/sec(GigaRays/sec,用來描述光線追蹤性能),每秒500T OPs深度學習,支持NVLink,每秒100GB,支持每秒500萬億張量的操作。
核心面積增至754平方毫米,最大顯存48GB GDDR6,集成186億晶體管,顯存頻率14GHz,可實現(xiàn)硬件加速的AI、光線追蹤和仿真。
現(xiàn)場,黃仁勛還展示了幾幀用Quadro RTX渲染《復(fù)仇者聯(lián)盟3》里蜘蛛俠跳起吐絲的畫面。
Quadro RTX系列新品的特性包括:
-
RT Core可實現(xiàn)對象和環(huán)境的實時光線追蹤,并做到物理上精確的陰影、反射和折射以及全局光照;
-
Tensor Core可加速深度神經(jīng)網(wǎng)絡(luò)訓練和推理;
-
圖靈流式多處理器(Turing Streaming Multiprocessor)架構(gòu)擁有4608個CUDA core,可提供高達16 teraflops的計算性能,并行運算每秒16萬億次整數(shù)運算,以加速模擬真實世界的物理模擬;
-
先進的可編程著色技術(shù)可提高復(fù)雜視效和圖形密集型工作體驗;
-
首次采用超快速的三星16Gb GDDR6內(nèi)存,支持更復(fù)雜的設(shè)計、海量建筑數(shù)據(jù)集、8K電影內(nèi)容等;
-
NVIDIA NVLink可通過高速鏈路聯(lián)通兩個GPU,將內(nèi)存容量擴展至96 GB,并可通過高達100GB / s的數(shù)據(jù)傳輸提供更高性能;
-
提供對USB Type-C和VirtualLink的硬件支持;
-
增強型技術(shù)可提高VR應(yīng)用性能,包括可變速率著色(Variable Rate Shading)、多視角渲染(Multi-View Rendering)和VRWorks Audio。
據(jù)雷鋒網(wǎng)了解, 三款新GPU預(yù)計今年第四季度發(fā)售, 開發(fā)人員可以通過新的NVIDIA RTX(TM)訪問Quadro RTX,并提供一系列創(chuàng)意應(yīng)用程序和工具,包括用于光線跟蹤,AI,光柵化和模擬的API。 價格方面,Quadro RTX 8000配備48GB內(nèi)存,售價10000美元;Quadro RTX 6000配24GB內(nèi)存,售價6300美元;Quadro RTX 5000配16GB內(nèi),2300美元ESP。
Quadro RTX服務(wù)器
在展示基于RTX的Porsche demo后,黃仁勛還發(fā)布了Quadro RTX服務(wù)器,它將Quadro RTX GPU與明年第一季度將推出新的Quadro Infinity軟件相結(jié)合,提供強大而靈活的架構(gòu),滿足創(chuàng)意專業(yè)人士的需求。Quadro Infinity將允許多個用戶通過虛擬工作站訪問單個GPU,從而顯著提高數(shù)據(jù)中心的密度。
據(jù)悉,Quadro RTX服務(wù)器預(yù)裝了領(lǐng)先的內(nèi)容創(chuàng)建和渲染軟件,提供功能強大且易于部署的渲染解決方案,可從小型安裝擴展到最大的數(shù)據(jù)中心,僅占CPU成本的四分之一渲染農(nóng)場。?
CUDA10
CUDA是構(gòu)建英偉達GPU加速的軟件,與之前的版本相比相比,CUDA10具有的新特性包括:
-
支持圖靈架構(gòu);
-
新增性能優(yōu)化庫,在16-GPU系統(tǒng)中實現(xiàn)強大的FFT性能擴展;
-
nvJPEG:用于混合JPEG處理的新庫,單個和批量圖像解碼速度是原來2倍;
-
CUDA / Graphics Interop:CUDA和圖形API之間的新互操作性;
-
新的開發(fā)人員工具:用于跟蹤,分析和調(diào)試CUDA應(yīng)用程序的新Nsight產(chǎn)品系列工具。
在軟件層面,英偉達還宣布開放MDL。
當然,黃仁勛最后還表示從Adobe(針對Dimension CC)到皮克斯、Siemens、Black Magic、Weta Digital、Epic Games和Autodesk等公司已經(jīng)簽約支持新的圖靈架構(gòu)。雷鋒網(wǎng)認為這將讓產(chǎn)品設(shè)計師、游戲設(shè)計師、建筑師們的光線計算開始變得簡單。
相關(guān)文章:
5 年提速 500 倍,英偉達 GPU 創(chuàng)紀錄突破與技術(shù)有哪些?
英偉達財報首次公布數(shù)字加密貨幣營收,但隨后股價下跌3.3%
英偉達在AI芯片領(lǐng)域真的無人能擋嗎?
英偉達推出首款A(yù)I和HPC的統(tǒng)一平臺HGX-2,售價39.9萬美元
。