首臺 E 級超算登頂 Top500 榜單:算力超過后七名之和
來源:機器之心?
機器之心報道
編輯:陳萍、澤南
Frontier 的算力達到了 1.102 Exaflops(10^18),實現了每秒百億億次運算。
5 月 30 日,第 59 屆 ISC 2022(國際超算大會)發布最新 Top500 榜單,美國田納西州橡樹嶺國家實驗室(ORNL)的 Frontier 成為第一個真正突破 Exascale 大關的超算,性能達到 1.102 exaflops,該榜單正式標志著超級計算新時代的到來。
Frontier 超算突破 Exaflops
Frontier 由 74 個 Cray EX 機柜組成,可容納 9408 個節點,每個節點配備一個 AMD Milan「Trento」7A53 Epyc CPU 和四個 AMD Instinct MI250X GPU,GPU 總數為 37632。節點通過 HPE 的 Slingshot-11 互連連接。每個節點 CPU 支持 512GiB DDR4 內存,跨節點支持 512GiB HMB2e(每 GPU 128GiB)內存。
Frontier 的 Linpack 性能為 1.102 exaflops,比 Top500 中的排名靠前的 7 個系統加起來還要快。來自田納西州橡樹嶺國家實驗室的 Thomas Zacharia 表示:「我們不能低估 0.1 的差距,一個 0.1 代表 100petaflops,0.1 看起來很小,很容易被四舍五入。但每個小數點都代表著一種巨大的能力?!?
Frontier 在 OLCF(美國橡樹嶺國家實驗室領先運算機構)占地 372 平方米,聚合了 9.2 PB 的內存(4.6 PB 的 DDR4 和 4.6 PB 的 HBM2e),有 37 PB 的節點本地存儲,并可訪問 716 PB 的中心范圍存儲。
Top10 榜單
四次登頂的日本超算 富岳 本次排在第二位,性能 442 petaflops,其采用 Arm A64FX 系統。
部署在芬蘭國家超算中心的? LUMI ?排名第三,使其成為歐洲最強大超算系統。LUMI 實現了 151.90 Linpack petaflops,理論峰值可達到 214.3 petaflops,這個數字大約為 71% 的 Linpack 效率。
IBM 的 ?Summit? 排名第四、 Sierra ?排名第五;中國的 天河 1A ,排名第六;美國勞倫斯伯克利實驗室的國家能源研究科學計算中心(NERSC) 的? Perlmutter HPE Cray EX ?排名第七;緊隨其后的是 英偉達 Selene ?排在第八位;中國的 天河 2A ?排名第九。
部署在法國國家大型計算中心的? Adastra 系統 排名第十,其 Linpack 實現 46.1 Linpack petaflops,理論峰值為 61.6 千萬億次,Linpack 效率為 75%。
值得一提的是,Top10 中新上榜的 3 臺新系統( 美國的 Frontier、芬蘭的 LUMI 和 法國的 Adastra )都是采用了? HPE Cray EX235a 架構 。
僅僅在四年前,也就是 2018 年 6 月,整個 Top500 榜單首次以 1.22 exaflops 的總和超過 exaflops 大關。現在 Frontier 的單個系統算力就達到了 1.102 Exaflops。
本次 Top500 榜單共迎來 39 個新系統,地域分布廣泛。 美國最多,有 9 個 ,其次是 德國的 5 個 。近十年來,中國首次沒有新系統上榜,盡管如此,中國仍然擁有列表中最多的系統:173 個,而美國系統數量為 127 個,就系統數量而言,美國位居第二。然而,美國由于 Frontier 的性能顯著拉長了領先優勢。
中國的超算進展
在國內的超級計算機計劃中已有三個 E 級超算上馬,這些系統本質上不是由 Top500 或 HPL 基準驗證的,而是由戈登貝爾獎。其中一個是無錫超級計算中心運營的 神威太湖之光 (新機位于青島)。
另一個系統 天河三號 位于天津市。Tianhe-3 基于 Phytium 2000+ FTP Arm 芯片和 Matrix 2000+ MTP 加速器。該系統據報道已于去年秋天完成,估計可以提供 1.7 exaflops 的峰值性能,在 Linpack 上提供了略高于 1.3 exaflops 的性能。
在漢堡舉行的 ISC 2022 之前,有消息人士表示,中國正計劃在 2025-2026 年的時間范圍內制造一臺 10 exaflops 的機器。另有消息人士稱,有兩臺目標 2025 年上線的 10 exaflops 系統正在開發中,但現在更大的可能是在 2026 年只推出一臺 10 exaflops 系統。與太湖之光一樣,它將是神威架構,即基于 Alpha 核心。
上海交通大學網絡信息中心副主任,HPC 專家林新華表示,Top500 已成為事實上的實體名單?!钢袊敿壋売嬎銠C的供應商和主機中心都在名單上,」他表示?!高M入 Top500 是為了促進國際合作,但結果卻適得其反。我們提交 Top500 并不是為了維持聯系?!?/p>
近年來,在 Top500 基準上的幾家中國系統的支持實體和供應商確實被列入了美國實體名單。
技術供應商
聯想是 Top500 榜單上的???,其參與基準測試的新系統數量最多(17 個),在 14 個新系統中,HPE 的數量位居第二(其中 7 個采用 AMD+AMD 節點,通過 Slingshot-11 連接,包括 三個 NNSA/LLNL 系統)。在所有 500 個系統中,按純系統數量計算的陣容是聯想(180 個)、HPE(84 個)和浪潮(50 個)。按性能份額比較的話,排名依次為:HPE(18.6%)、富士通(18.1%)和聯想(15.1%)。
名單上沒有新的英偉達系統。其自用的 Eos 超算將會展示它的最新實力,但為 Eos 提供算力的 DGX H100 節點預計直到下個季度才會發貨。
英偉達是該列表中 19 個系統的制造商,并且它合作參與了另外 5 個系統的構建,包括第五位的 Sierra、第 22 位的 Chervonenkis 、第 30 位的 Lassen、第 40 位的 Galushkin 和第 43 位的 Lyapunov。
英特爾聲稱在 Top500 排行榜中占有 77.40% 的份額,這個數字低于六個月前的 81.60%。AMD 共有 94 個系統,在該列表中的份額已從六個月前的 14.60% 增長到 18.80%。
IBM 的超算數量仍然未變是 9 個:第 4 名的 Summit、第 5 名的 Sierra、第 21 名的 Marconi-100、第 30 名的 Lassen、第 33 名的 PANGEA II、第 24 名的 AiMOS、第 160 名的 HPC2 第 205 名的 SuperMUC Phase2(與聯想合作)和第 303 名的 Longhorn。