昨天凌晨4点20,马斯克发推文声称第四色第4色,我方刚刚启动了寰宇上最强的AI稽查集群。
这个超算中心位于好意思国田纳西州,孟菲斯,使用了100,000个(无谓数了!是10万个!)英伟达H100液冷GPU,通过单一RDMA鸠合衔接 。
RDMA(Remote Direct Memory Access)即云尔径直内存考查,它不错把数据径直从一台狡计机传输到另一台狡计机,无需两边操作系统的介入。单一RDMA打造了高迷糊、低蔓延的鸠合通讯,尤其相宜在大限制并行狡计机集群中使用。
感谢xAI,X团队,英伟达以过头他厂商的扶持|X@elonmusk
单从限制来看,xAI孟菲斯超算中心照旧在算力上踏进寰宇第一,不仅远远逾越了OpenAI用来稽查GPT-4的2.5万块A100 GPU,也杰出了Aurora(60,000 个 Intel GPU)和Microsoft Eagle(14,400 个 Nvidia H100 GPU),以致逾越了此前的寰宇第一超算Frontier(37,888 个 AMD GPU)。
H100是英伟达专为措置大型言语模子数据而开发的芯片,每块芯片价钱或者在3万好意思元驾驭,也等于说xAI此次建的超算中心仅是芯片的价值就高达30亿好意思元。
此前,马斯克的xAI一直不冷不热,xAI推出的东谈主工智能Grok也常常被各人吐槽不好用,但以现在的景色来看,大模子稽查等于一场算力游戏,再往下深究是动力游戏,而马斯克不肯意再等了,径直把料堆满。
他示意第四色第4色,修订后的大模子(不出巧合的话是Grok3)会在本年年底完成,届时它将会是寰宇上最弘大的AI。
2014年的马斯克:咱们正在召唤AI恶魔;2024年的马斯克:我要我方召唤AI恶魔!!|X@JoshWhiton
古典武侠其实,英伟达照旧推出了新一代的H200芯片和基于Blackwell新架构的B100和B200 GPU,但是更先进的芯片要在本年年底才智出货,何况也不成一下变出几万张来,也许是为了抢在ChatGPT5之前成为寰宇最强,马斯克此次比平淡愈加大干快上。
据福布斯称,本年3月马斯克才在孟菲斯敲定这项契约,之后这座超算基地简直立即开工。为了加速速率,马斯克从甲骨文借了2.4万块H100。
可是如前文所说,现在的大模子稽查归根结底是动力游戏,而好意思国的电网系统相称腐化,照旧有几十年莫得见证过大限制增长,尤其是AI稽查的用电结构和民用商用电很不相同,常常会一霎出现超高的用电波峰,极地面挑战电网的最大负荷。在这种情况下能挤出电力水力资源扶持超算中心的场地所剩无几。
据孟菲斯电力、自然气和水务公司的首席推论官预计,xAI孟菲斯超算集群每小时使用的电力最高会达到150兆瓦,相称于10万户家庭的用电量。
现在孟菲斯工场有3.2万块GPU在线,展望本年第四季度供电开采将会完成,工场将会全速动手。
也难怪会有东谈主质疑马斯克在撒谎,因为这个电力要乞降这个开采速率真实是太不可想议了。
其后质疑马斯克的东谈主谈歉了,他发现马斯克简直办到了|DylanPatel@X
除了用电除外,xAI超算集群展望每天至少需要100万加仑(约379万升)的水来散热。
据福布斯报谈,孟菲斯市议会议员Pearl Walker上周示意:“全球很狭小。他们总结水资源可能出现问题,也总结动力供应出现问题。”她说,现在数据中心展望每天需要从孟菲斯的地下蓄水层,也等于该市的主要水源中抽取492万升(该市每天所有这个词耗尽约莫5.68亿升水)。自然他们说这仅仅暂时的,但新的灰水工场的建造缱绻还没定,孟菲斯的公用办事部门也阐明,在措置厂建成动手之前,马斯克的超等狡计机将被允许使用地下蓄水层的水。
除了马斯克,OpenAI和微软也在部署更大限制的超算,这台名叫“星际之门”的超算芯片数目会达到百万级,资本展望高达1150亿好意思元,缱绻在2028年推出。
本年四月,OpenAI把微软电网搞崩溃了,据微软工程师说,他们那时正在为GPT-6部署10万个H100稽查集群,不知谈马斯克会不会成为第一个让10万个H100系数职责的东谈主呢?
作家:翻翻
裁剪:odette第四色第4色