10万块芯片,马斯克用最大超算挑战GPT
金融掌舵
2024-10-27 22:58:17
0

昨天凌晨4点20,马斯克发推文宣称,自己刚刚启动了世界上最强的AI训练集群。

这个超算中心位于美国田纳西州,孟菲斯,使用了100,000个(不用数了!是10万个!)英伟达H100液冷GPU,通过单一RDMA网络连接 。

RDMA(Remote Direct Memory Access)即远程直接内存访问,它可以把数据直接从一台计算机传输到另一台计算机,无需双方操作系统的介入。单一RDMA打造了高吞吐、低延迟的网络通信,尤其适合在大规模并行计算机集群中使用。

感谢xAI,X团队,英伟达以及其他厂商的支持|X@elonmusk

单从规模来看,xAI孟菲斯超算中心已经在算力上跻身世界第一,不仅远远超过了OpenAI用来训练GPT-4的2.5万块A100 GPU,也超越了Aurora(60,000 个 Intel GPU)和Microsoft Eagle(14,400 个 Nvidia H100 GPU),甚至超过了此前的世界第一超算Frontier(37,888 个 AMD GPU)。

H100是英伟达专为处理大型语言模型数据而开发的芯片,每块芯片价格大概在3万美元左右,也就是说xAI这次建的超算中心仅是芯片的价值就高达30亿美元。

此前,马斯克的xAI一直不温不火,xAI推出的人工智能Grok也经常被大家吐槽不好用,但以目前的状况来看,大模型训练就是一场算力游戏,再往下深究是能源游戏,而马斯克不愿意再等了,直接把料堆满。

他表示,改进后的大模型(不出意外的话是Grok3)会在今年年底完成,届时它将会是世界上最强大的AI。

2014年的马斯克:我们正在召唤AI恶魔;2024年的马斯克:我要自己召唤AI恶魔!!|X@JoshWhiton

其实,英伟达已经推出了新一代的H200芯片和基于Blackwell新架构的B100和B200 GPU,但是更先进的芯片要在今年年底才能出货,而且也不能一下变出几万张来,也许是为了抢在ChatGPT5之前成为世界最强,马斯克这次比平时更加大干快上。

据福布斯称,今年3月马斯克才在孟菲斯敲定这项协议,之后这座超算基地几乎立即开工。为了加快速度,马斯克从甲骨文借了2.4万块H100。

然而如前文所说,目前的大模型训练归根结底是能源游戏,而美国的电网系统相当陈旧,已经有几十年没有见证过大规模增长,尤其是AI训练的用电结构和民用商用电很不一样,经常会突然出现超高的用电波峰,极大地挑战电网的最大负荷。在这种情况下能挤出电力水力资源支持超算中心的地方所剩无几。

据孟菲斯电力、天然气和水务公司的首席执行官估计,xAI孟菲斯超算集群每小时使用的电力最高会达到150兆瓦,相当于10万户家庭的用电量。

目前孟菲斯工厂有3.2万块GPU在线,预计今年第四季度供电建设将会完成,工厂将会全速运行。

也难怪会有人质疑马斯克在撒谎,因为这个电力要求和这个建设速度实在是太不可思议了。

后来质疑马斯克的人道歉了,他发现马斯克真的办到了|DylanPatel@X

除了用电之外,xAI超算集群预计每天至少需要100万加仑(约379万升)的水来散热。

据福布斯报道,孟菲斯市议会议员Pearl Walker上周表示:“民众很害怕。他们担心水资源可能出现问题,也担心能源供应出现问题。”她说,目前数据中心预计每天需要从孟菲斯的地下蓄水层,也就是该市的主要水源中抽取492万升(该市每天总共消耗大约5.68亿升水)。虽然他们说这只是暂时的,但新的灰水工厂的建造计划还没定,孟菲斯的公用事业部门也证实,在处理厂建成运行之前,马斯克的超级计算机将被允许使用地下蓄水层的水。

除了马斯克,OpenAI和微软也在部署更大规模的超算,这台名叫“星际之门”的超算芯片数量会达到百万级,成本预计高达1150亿美元,计划在2028年推出。

今年四月,OpenAI把微软电网搞崩溃了,据微软工程师说,他们当时正在为GPT-6部署10万个H100训练集群,不知道马斯克会不会成为第一个让10万个H100一起工作的人呢?

作者:翻翻

编辑:odette

封面图来源:datacenterdynamics

相关内容

深圳明确:“取卵术”等试管...
南都讯 记者张小玲 李榕 广东省医疗保障局已明确,10月1日起...
2024-12-02 23:02:43
中科三环(000970):...
title===>中科三环(000970):科技创新领军,投资价值...
2024-11-26 23:16:32
实盘股票配资平台:助力投资...
title===>实盘股票配资平台:助力投资者放大收益[field...
2024-11-20 23:51:39
用户期待落空?三星One ...
早期接触到One UI 7的用户反馈称,该版本目前仍存在“诸多问题...
2024-10-29 22:58:11
10万块芯片,马斯克用最大...
昨天凌晨4点20,马斯克发推文宣称,自己刚刚启动了世界上最强的AI...
2024-10-27 22:58:17
同程旅行获得证券之星ESG...
7月19日,“新视野 新未来”2024证券之星ESG研讨会圆满收官...
2024-10-12 13:01:38

热门资讯

高股息行情持续性如何 自2021年迄今,高分红策略已持续三年超越万得全A指数的收益表现。对于这一趋势是否会在未来得以保持,...
(新春走基层)“海巡22”上的...   “汪船长,我们知道你肯定会来,主机已经备好了,随时可以出发。”2月8日,大年二十九,本该在家休息...
赛恩斯(688480)3月8日... 证券之星消息,截至2024年3月8日收盘,赛恩斯(688480)报收于35.45元,下跌1.25%,...
去中国最北的县城,赶最早的早市... 中国最北的县城,不是漠河,不是黑河,而是塔河。最北极的地标在漠河,不过是漠河是个县级市,我感觉叫最北...
什么鸟羽毛值20几万?未经许可... 什么鸟羽毛值20几万?未经许可还不允许踏出国门!2024年5月,在新西兰一场拍卖会上,这根羽毛最终的...
警惕“套路运”贷款风险 近期,不少网络平台出现这样的广告,声称贷款买货车可以“零首付”,还能享受“免息”等优惠,购车后物流公...
CySEC延长了英国脱欧后本地... 周四1月28日报道,塞浦路斯证券交易委员会(CySEC)对于那些在英国脱欧后愿意在欧盟岛国临时许可制...
捷安高科(300845SZ):... 格隆汇7月18日丨捷安高科(300845.SZ)于2024年7月18日接受投资者调研,就“公司轨道和...
期货被骗报警最有效途径 title===>期货被骗报警最有效途径[field]body===>期货市场风险高,不法分子利用信...
中航高科现283亿元平价大宗交... 中航高科2月20日大宗交易成交1499.53万股,成交额2.83亿元,占当日总成交额的65.63%,...