英伟达阻击国产 AI 芯片,“中国特供版” H20 综合算力比 H100 降 80%
英伟达阻击国产 AI 芯片,“中国特供版” H20 综合算力比 H100 降 80%
英伟达 Logo(来源:钛媒体 App 编辑拍摄)
11 月 10 日,近日有消息称,芯片巨头英伟达(NVIDIA)将基于 H100 推出三款针对中国市场的 AI 芯片,以应对美国最新的芯片出口管制。
规格文件中显示,英伟达即将向中国客户推出新产品分别名为 HGX H20、L20 PCle、L2 PCle,基于英伟达的 Hopper 和 Ada Lovelace 架构。从规格和命名来看,三款产品针对的是训练、推理和边缘场景,最快将于 11 月 16 日公布,产品送样时间在今年 11 月至 12 月,量产时间为今年 12 月至明年 1 月。
钛媒体 App 从多位英伟达产业链公司了解到,上述消息属实。
钛媒体 App 还独家了解到,英伟达的这三款 AI 芯片并非 " 改良版 ",而是 " 缩水版 "。其中,用于 AI 模型训练的 HGX H20 在带宽、计算速度等方面均有所限制,理论上,整体算力要比英伟达 H100 GPU 芯片降 80% 左右,即 H20 等于 H100 的 20% 综合算力性能,而且增加 HBM 显存和 NVLink 互联模块以提高算力成本。所以,尽管相比 H100,HGX H20 价格会有所下降,但预计该产品价格仍将比国内 AI 芯片 910B 高一些。
" 这相当于将高速公路车道扩宽,但收费站入口未加宽,限制了流量。同样在技术上,通过硬件和软件的锁,可以对芯片的性能进行精确控制,不必大规模更换生产线,即便是硬件升级了,性能仍然可以按需调节。目前,新的 H20 已经从源头上‘卡’住了性能。" 一位行业人士这样解释新的 H20 芯片," 比如,原先用 H100 跑一个任务需要 20 天,如今 H20 再跑可能要 100 天。"
尽管美国发布新一轮芯片限制措施,但英伟达似乎并没有放弃中国巨大的 AI 算力市场。
那么,国产芯片是否可以替代?钛媒体 App 了解到,经过测试,目前在大模型推理方面,国内 AI 芯片 910B 仅能达到 A100 的 60%-70% 左右,集群的模型训练难以为继;同时,910B 在算力功耗、发热等方面远高于英伟达 A100/H100 系列产品,且无法兼容 CUDA,很难完全满足长期智算中心的模型训练需求。
截止目前,英伟达官方对此并未做出任何评论。
据悉,今年 10 月 17 日,美国商务部工业和安全局(BIS)发布了针对芯片的出口管制新规,对包括英伟达高性能 AI 芯片在内的半导体产品施加新的出口管制;限制条款已经于 10 月 23 日生效。英伟达给美国 SEC 的备案文件显示,立即生效的禁售产品包括 A800、H800 和 L40S 这些功能最强大的 AI 芯片。
另外,L40 和 RTX 4090 芯片处理器保留了原有 30 天的窗口期。
10 月 31 日曾有消息称,英伟达可能被迫取消价值 50 亿美元的先进芯片订单,受消息面影响,英伟达股价一度大跌。此前,英伟达为中国专供的 A800 和 H800,由于美国新规而无法正常在中国市场销售,而这两款芯片被称为 A100 及 H100 的 " 阉割版 ",英伟达为了符合美国之前的规定而降低了芯片性能。
10 月 31 日,中国贸促会新闻发言人张鑫表示,美方新发布的对华半导体出口管制规则,进一步加严了人工智能相关芯片、半导体制造设备对华出口的限制,并将多家中国实体列入出口管制 " 实体清单 "。美国这些措施严重违反了市场经济原则和国际经贸规则,加剧了全球半导体供应链撕裂与碎片化风险。美国自 2022 年下半年开始实施的对华芯片出口禁令正在深刻改变全球供需,造成 2023 年芯片供应失衡,影响了世界芯片产业格局,损害了包括中国企业在内的各国企业的利益。
英伟达 HGX H20、L20、L2 与其他产品的性能参数对比
钛媒体 App 了解到,新的 HGX H20、L20、L2 三款 AI 芯片产品,分别基于英伟达的 Hopper 和 Ada 架构,适用于云端训练、云端推理以及边缘推理。
其中,后两者 L20、L2 的 AI 推理产品有类似的 " 国产替代 "、兼容 CUDA 的方案,而 HGX H20 是基于 H100、通过固件阉割方式 AI 训练芯片产品,主要替代 A100/H800,国内除了英伟达,模型训练方面很少有类似国产方案。
文件显示,新的 H20 拥有 CoWoS 先进封装技术,而且增加了一颗 HBM3(高性能内存)到 96GB,但成本也随之增加 240 美元;H20 的 FP16 稠密算力达到 148TFLOPS(每秒万亿次浮点运算),是 H100 算力的 15% 左右,因此需要增加额外的算法和人员成本等;NVLink 则由 400GB/s 升级至 900GB/s,因此互联速率会有较大升级。
据评估,H100/H800 是目前算力集群的主流实践方案。其中,H100 理论极限在 5 万张卡集群,最多达到 10 万 P 算力;H800 最大实践集群在 2 万 -3 万张卡,共计 4 万 P 算力;A100 最大实践集群为 1.6 万张卡,最多为 9600P 算力。
然而,如今新的 H20 芯片,理论极限在 5 万张卡集群,但每张卡算力为 0.148P,共计近为 7400P 算力,低于 H100/H800、A100。因此,H20 集群规模远达不到 H100 的理论规模,基于算力与通信均衡度预估,合理的整体算力中位数为 3000P 左右,需增加更多成本、扩展更多算力才能完成千亿级参数模型训练。
两位半导体行业专家向钛媒体 App 表示,基于目前性能参数的预估,明年英伟达 B100 GPU 产品很有可能不再向中国市场销售。
整体来看,如果大模型企业要进行 GPT-4 这类参数的大模型训练,算力集群规模则是核心,目前只有 H800、H100 可以胜任大模型训练,而国产 910B 的性能介于 A100 和 H100 之间,只是 " 万不得已的备用选择 "。
如今英伟达推出的新的 H20,则更适用于垂类模型训练、推理,无法满足万亿级大模型训练需求,但整体性能略高于 910B,加上英伟达 CUDA 生态,从而阻击了在美国芯片限制令下,国产卡未来在中国 AI 芯片市场的唯一选择路径。
最新财报显示,截至 7 月 30 日的一个季度内,英伟达 135 亿美元的销售额中,有超过 85% 份额来自美国和中国,只有大约 14% 的销售额来自其他国家和地区。
受 H20 消息影响,截至美股 11 月 9 日收盘,英伟达股价微涨 0.81%,报收 469.5 美元 / 股。近五个交易日,英伟达累涨超过 10%,最新市值达 1.16 万亿美元。
(本文首发钛媒体 App,作者|林志佳)
-
- 巴以冲突第六天,最触目惊心的图片出现了
-
2023-11-10 23:36:23
-
- “假”靳东被诉,“真”靳东发声
-
2023-11-10 23:34:07
-
- 国产自研系统扎堆,去年的潘塔纳尔怎么样了 ?
-
2023-11-10 23:31:51
-
- 被苹果抛弃,欧菲光依赖“华链”绝地反击
-
2023-11-10 23:29:35
-
- 西方都支持以色列?法国有话说
-
2023-11-10 23:27:19
-
- 聚焦金融风险,央行、高盛、桥水高层重磅发声
-
2023-11-10 23:25:03
-
- 时隔 17 年再度盈利,AC 米兰做对了什么?
-
2023-11-10 23:22:47
-
- 奏响“快乐的旋律”,杜菲领衔西岸美术馆秋季展
-
2023-11-10 23:20:31
-
- 女子路怒咬掉男子一块肉?警方通报
-
2023-11-10 11:56:12
-
- 幼儿园保育员抱摔孩子致其牙齿松动?山东成武警方:拘留!
-
2023-11-10 11:53:57
-
- 德国超市品牌有哪些(德国有哪些超市品牌名称)
-
2023-11-10 11:51:41
-
- 永州冷水滩区纪委监委:副处职级干部蒋某某涉赌属实,已对其立案
-
2023-11-10 11:49:25
-
- 女子疑因路怒咬掉男子一块肉?警方通报
-
2023-11-10 11:47:10
-
- 巴以新一轮大规模冲突持续 联合国机构呼吁立即实现停火
-
2023-11-10 11:44:54
-
- 比 ChatGPT 等竞品更幽默,马斯克 xAI 推出首个产品 Grok
-
2023-11-10 11:42:38
-
- 斑马线外 3 万、线内 30 万?交警辟谣
-
2023-11-10 11:40:22
-
- 泽连斯基:新一轮巴以冲突转移了世人对乌克兰危机的关注
-
2023-11-10 11:38:06
-
- 比亚迪认证二手车商城明日上线,提供 360 度看车功能
-
2023-11-10 11:35:51
-
- 有编制的工作有哪些(事业编都有什么岗位)
-
2023-11-09 11:42:40
-
- 国庆节的风俗有哪些传统(国庆节的风俗及寓意)
-
2023-11-09 11:40:24