人工智能 (AI) 領頭羊 NVIDIA 最近宣布,Colossus 是世界上最大的超級計算機集群拇舀,用于訓練 xAI 的 Grok 系列大型語言模型(LLMs)漱屁,它依賴于 NVIDIA 的 800 Gbit/s Spectrum SN5600 以太網(wǎng)交換機以及該公司 Spectrum-X 以太網(wǎng)網(wǎng)絡平臺中的其他產(chǎn)品,用于 Colossus 的遠程直接內(nèi)存訪問 (RDMA) 網(wǎng)絡株矩。NVIDIA 表示茧津,該平臺“旨在為使用基于標準的以太網(wǎng)的多租戶、超大規(guī)模 AI 工廠提供卓越的性能”碱跃。
Colossus 目前包含 100000 個 NVIDIA Hopper GPU(圖形處理單元)营鸽,并且正在翻倍以包含 200000 個 Hopper。Colossus 位于美國田納西州孟菲斯园湘。
NVIDIA 在宣布以太網(wǎng)平臺在集群中的作用時表示:“xAI 和 NVIDIA 在短短 122 天內(nèi)就構(gòu)建了支持設施和最先進的超級計算機奴万,而這種規(guī)模的系統(tǒng)通常需要數(shù)月到數(shù)年的時間框架。
“Colossus 是世界上最強大的訓練系統(tǒng)单墓,”Elon Musk 在 X 上說个荔,“xAI 團隊、NVIDIA 和我們的許多合作伙伴/供應商都做得不錯返工。
NVIDIA 進一步報告說易贿,在網(wǎng)絡結(jié)構(gòu)的所有三個層中,由于流沖突而導致的應用程序延遲降級或數(shù)據(jù)包丟失為零嫡纠》匙猓“它通過 Spectrum-X 擁塞控制保持了 95% 的數(shù)據(jù)吞吐量,”NVIDIA 表示除盏〔娉鳎“標準以太網(wǎng)無法大規(guī)模實現(xiàn)這種性能水平,因為標準以太網(wǎng)會產(chǎn)生數(shù)千次流沖突,而數(shù)據(jù)吞吐量僅為 60%窃祝∑桑”
“AI 正在成為任務關鍵型,需要提高性能粪小、安全性甩栈、可擴展性和成本效益,”NVIDIA 網(wǎng)絡高級副總裁 Gilad Shainer 說糕再。NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡平臺旨在為 xAI 等創(chuàng)新者提供更快的 AI 工作負載處理量没、分析和執(zhí)行速度,進而加快 AI 解決方案的開發(fā)突想、部署和上市時間殴蹄。
xAI 的一位發(fā)言人表示,它已經(jīng)構(gòu)建了世界上最大侄侨、最強大的超級計算機兄哮。NVIDIA 的 Hopper GPU 和 Spectrum-X 使我們能夠突破大規(guī)模訓練 AI 模型的界限,創(chuàng)建基于以太網(wǎng)標準的超級加速和優(yōu)化的 AI 因素气凫。
Spectrum SN5600 支持高達 800 Gbits/s 的速度参匀,基于 Spectrum-4 交換機 ASIC。xAI 正在將 Spectrum-X SN5600 交換機與 NVIDIA BlueField-3 SuperNIC 配對市协。
NVIDIA 在公告結(jié)束時表示昭仓,用于 AI 的 Spectrum-X 以太網(wǎng)網(wǎng)絡“帶來了先進的功能,可提供高效且可擴展的帶寬瞬芒,具有低延遲和短尾延遲凯辆,以前是 InfiniBand 獨有的。這些功能包括采用 NVIDIA Direct Path Placement 技術的自適應路由接吠、擁塞控制以及增強的 AI Fabric 可見性和性能隔離宜裂,這些都是多租戶生成式 AI 云和大型企業(yè)環(huán)境的關鍵要求。
11月7日缕圣,由千家網(wǎng)聯(lián)合陜西省土木建筑學會智能建筑與智慧城市專業(yè)委員會掀哎、陜西省土木建筑學會建筑電氣專業(yè)委員會主辦的2024年第25屆CIBIS建筑智能化峰會西安站將在西安萬麗酒店隆重舉辦。屆時旺坠,來自中國建筑西北設計研究院 乔遮、西安電子科技大學、中國電建西北院等業(yè)內(nèi)專家將攜手全球知名智能化品牌企業(yè)价淌,共同探討綠色低碳申眼、健康建筑瞒津、智慧樓宇蝉衣、建筑能效管理等熱點話題,分享如何利用更智慧、更高效病毡、更安全濒翻、更低碳的智慧技術,共同開啟未來美好智慧生活啦膜。