大国博弈,值得深知!最近详细捋了一下芯片禁令以及英伟达芯片禁售的事情,感觉挺有意思的,值得一读。
在2025年7月14日,一向爱穿皮夹克的英伟达黄仁勋,在中国链博会上穿上了唐装,并且宣布了一个重磅消息:
“美国政府已经批准了英伟达AI芯片H20的出口许可,很快就能向中国市场提供”。
这对很多国内ICer来说是非常值得关注的事情,几乎同时AMD也宣布,将很快恢复向中国市场交付AI芯片MI308。
不少人是不是觉得关税战中国取得了话语权,同时美国看到中国AI芯片行业的崛起,想要通过H20来占据中国市场呢?
其实我们应该了解到一点的是,对于美国来说,就是想方设法限制中国的发展,最快最有效的就是在芯片领域限制;但是在黄老板的视角里,中国市场是巨大的,也是无法放弃的,从利益的角度上一定是想继续卖产品给中国的。
所有这次H20的解禁,就是黄老板在中美之间,不断奔走游说的结果。
2022年,英伟达发布了旗舰版AI芯片——H100,因为采用了全新架构,所以比上一代A100提升了数倍的计算性能。可以说是当时最好的芯片了,当然,这么好的芯片,美国是不会同意卖给中国的,当然黄老板是很想卖给中国的,因为全世界除了中国,很少有国家能在AI产业上投入巨大,当时全球算力格局中,美国占36%,中国占31%,排在第三名的日本仅占6%。也就是说H100这么好的东西除了美国外,却找不到很好的买家了,眼看中国这么大的市场却吃不到嘴里,黄老板想了个变通的办法,在H100的基础上阉割了数据传输速率,将集群卡之间的互连速度从H100的900GB/s,限制在了400GB/s以内,造出了H800芯片。
因为从单个芯片的数据传输速率上来看,H800是在美国限制之外的,而且对于中国H800集群进行千亿级参数模型训练时,那么训练效率就会大大下降,只会事倍功半,耽误中国人的时间,所以出口中国是没问题的。。
黄老板就拿着这个H800,去找了美国商务部工业与安全局(BIS)说明了情况,最终H800拿下了许可证。
我们都知道,虽然被阉割,不过H800仍然是当时中国能拿到的最好的AI芯片了,所以无论是腾讯、字节还是阿里,都花了大价钱大量购买H800。
然后,事情就变得有趣起来了!
中国人面对集群算力限制,逐渐琢磨出了通过算法减少运算量的方案,使训练成本比美国同行低了10倍!从“大力出奇迹”,变成了“小力也能出奇迹”。
比如幻方量化旗下的DeepSeek-V3,就是用了“蒸馏技术”,只用了2048块H800显卡就训练出来了。
这样一来,光H800的性能,就足够中国AI再上一个新台阶了。
这个结果是黄老板和BIS万万没想到的,还能这么搞,不行不行,于是很快就收紧了AI芯片管控政策。
2024年10月,BIS在最新管控文件中,正式提出了“性能密度”这一概念,每平方毫米性能密度达到370 GFLOPS,或者总算力达到300 TFLOPS,这两条只要符合一条,就不能出口。
而H800,恰恰就处在管控范围之内,没法再往中国卖了。
那怎么办?放弃中国市场显然是黄老板不想的,于是故技重施,再次阉割,推出了H20。
H20完全符合了BIS“性能密度”的要求,FP8算力仅为296TFLOPS,相较于H100的1979TFLOPS,已经不足后者的15%。
BIS一看没话说了,合理合规,就批准了出口许可。
但是英伟达耍了个心机:你只限制了我的总算力和性能密度,但没限制带宽,虽然H20大幅度阉割了算力,但在内存和带宽方面,却来了一次升级。
比如H100的内存是80GB,而H20的内存却达到了96GB,H100的带宽是3.35TB/s,而H20的带宽则达到了4TB/s。
这种大内存、大带宽设计,可满足大规模矩阵运算、深度学习等计算密集型任务对数据吞吐量的需求,尤其在处理高维度数据时能减少延迟,提升整体运算效率。
同时,H20还支持NVLink互联进行多卡协同,适用于需要高并发推理的场景(如长文本生成),所以在大语言模型推理方面,没有比H100差太多。
说实话,H20如果单纯看算力,其实已经不如国产的昇腾910B了,但就是靠着自己的内存和带宽优势,再加上CUDA生态的支持,允许多张卡高效协同工作,所以对国产AI企业来说,想玩大模型,首选的方案仍然是H20,就算知道它是阉割的,大家也只能一边骂一边买。
但是,不光是国内企业一边骂一边卖,美国的BIS又发现了黄老板钻的空子,于是今年4月份,BIS再次发布了新规,要求DRAM总带宽≥1400GB/s、I/O带宽≥1100GB/s,或两者总和≥1700GB/s的产品都受到管制。
这样一来,H20也没法卖了。一同受影响的,还有英特尔的Gaudi,以及AMD的MI308。
面对最新禁令,黄老板真的欲哭无泪,因为大模型的爆火,中国对H20的需求很大,H20排产计划很高,结果一纸禁令袭来,就算立即下令停产,相关的库存也有几十万块了,几十亿美元的投入了。
除了中国也卖不了其他国家,因为国外有能力买的直接就上H100和H200了,根本没人买阉了又阉的H20了。眼看这么多库存H20咋办?只能堆着等落后,变成垃圾。
黄老板,也只能开始在中美之间飞来飞去,开始了他的公关行动,最终终于说动了特朗普-当然就是使用钞能力。
4月14日,黄仁勋在白宫和特朗普共同宣布了一个消息,将在4年内在美国投资5000亿美元,联合台积电、富士康、纬创资通、安靠科技和硅精工业,将世界芯片制造中心从台湾转到美国,彻底改变芯片产业供应链。
一切差不多都谈妥了,结果更大的事情来了,4月份,是中美关税战打得一塌糊涂的时候,特朗普嘴硬好面子,这个时候解禁H20不合适。
直到6月10日,中美代表团在伦敦会谈,达成了框架性协议。从近一个月以来的动作来看,都是在落实这个框架协议,中国放松了稀土管制,而美国也放松了EDA、航空发动机和乙烷的管制,中美关系大大缓和,时机总算成熟了。
7月10日,黄仁勋再次前往白宫,终于得到了特朗普关于解禁H20的承诺。然后黄仁勋带着这份承诺,在7月11日飞往中国,参加链博会,7月14日,黄仁勋官宣H20解禁的消息。
上面就是英伟达从H100到H800,再到H20的历程了。再来看看国内的发展。
AI昇腾920芯片,基于中芯国际?6nm工艺打造,算力达900?TFLOPS,同时内存将升级到HBM3,单卡提供4TB/s的带宽,而且还可以通过达芬奇架构3.0进行硬件加速和软件协同,算是国产AI芯片中,唯一能媲美H100的了,并且在2025年4月,经过测试,昇腾训练率达到了H100的105%,听起来很厉害,不过需要注意的是,H100是2022年的芯片了,这三年时间里,2023年推出了H100的升级版H200,随后又更新到了GB200,今年3月又量产了更强的GB300,一颗GB300的理论算力约为45颗H100,算力异常强大,专为下一代万亿参数级大模型而生。
相比中国刚刚搞到H100的水平,这是多么巨大的一个差距?
目前,中美在AI领域的竞争如火如荼,最核心就是时间和产能了。这两个问题都是很难在短期突破的,据说NV又给中国定制了一款芯片B30,虽然B30算力比H20再降20%,内存从高速HBM3更换成了低速GDDR7,但能不能拿到BIS的出口许可证,仍是个未知数。
所有企业和国家都会提前布局和规划,不会等着靠外国给点我们用点,而且很多关键企业用国产AI芯片才保险,国家甚至给高额补贴让企业购买国产AI芯片。
为什么我会觉得很有意思呢?就是身处当前的时代洪流中,每一天都会有很多竞争,甚至可以说是战争,国内企业直接的商业大战,国际上大国斗争和博弈。从H20这块小小的芯片就可见一斑。
中国的芯片故事还有很多,要走的路也很长,未来谁是主角要随时间洪流不断角逐!