从H100到H800，再到H20，都经历了什么？看大国博弈！

大国博弈，值得深知！最近详细捋了一下芯片禁令以及英伟达芯片禁售的事情，感觉挺有意思的，值得一读。

在2025年7月14日，一向爱穿皮夹克的英伟达黄仁勋，在中国链博会上穿上了唐装，并且宣布了一个重磅消息：

“美国政府已经批准了英伟达AI芯片H20的出口许可，很快就能向中国市场提供”。

这对很多国内ICer来说是非常值得关注的事情，几乎同时AMD也宣布，将很快恢复向中国市场交付AI芯片MI308。

不少人是不是觉得关税战中国取得了话语权，同时美国看到中国AI芯片行业的崛起，想要通过H20来占据中国市场呢？

其实我们应该了解到一点的是，对于美国来说，就是想方设法限制中国的发展，最快最有效的就是在芯片领域限制；但是在黄老板的视角里，中国市场是巨大的，也是无法放弃的，从利益的角度上一定是想继续卖产品给中国的。

所有这次H20的解禁，就是黄老板在中美之间，不断奔走游说的结果。

2022年，英伟达发布了旗舰版AI芯片——H100，因为采用了全新架构，所以比上一代A100提升了数倍的计算性能。可以说是当时最好的芯片了，当然，这么好的芯片，美国是不会同意卖给中国的，当然黄老板是很想卖给中国的，因为全世界除了中国，很少有国家能在AI产业上投入巨大，当时全球算力格局中，美国占36%，中国占31%，排在第三名的日本仅占6%。也就是说H100这么好的东西除了美国外，却找不到很好的买家了，眼看中国这么大的市场却吃不到嘴里，黄老板想了个变通的办法，在H100的基础上阉割了数据传输速率，将集群卡之间的互连速度从H100的900GB/s，限制在了400GB/s以内，造出了H800芯片。

因为从单个芯片的数据传输速率上来看，H800是在美国限制之外的，而且对于中国H800集群进行千亿级参数模型训练时，那么训练效率就会大大下降，只会事倍功半，耽误中国人的时间，所以出口中国是没问题的。。

黄老板就拿着这个H800，去找了美国商务部工业与安全局（BIS）说明了情况，最终H800拿下了许可证。

我们都知道，虽然被阉割，不过H800仍然是当时中国能拿到的最好的AI芯片了，所以无论是腾讯、字节还是阿里，都花了大价钱大量购买H800。

然后，事情就变得有趣起来了！

中国人面对集群算力限制，逐渐琢磨出了通过算法减少运算量的方案，使训练成本比美国同行低了10倍！从“大力出奇迹”，变成了“小力也能出奇迹”。

比如幻方量化旗下的DeepSeek-V3，就是用了“蒸馏技术”，只用了2048块H800显卡就训练出来了。

这样一来，光H800的性能，就足够中国AI再上一个新台阶了。

这个结果是黄老板和BIS万万没想到的，还能这么搞，不行不行，于是很快就收紧了AI芯片管控政策。

2024年10月，BIS在最新管控文件中，正式提出了“性能密度”这一概念，每平方毫米性能密度达到370 GFLOPS，或者总算力达到300 TFLOPS，这两条只要符合一条，就不能出口。

而H800，恰恰就处在管控范围之内，没法再往中国卖了。

那怎么办？放弃中国市场显然是黄老板不想的，于是故技重施，再次阉割，推出了H20。

H20完全符合了BIS“性能密度”的要求，FP8算力仅为296TFLOPS，相较于H100的1979TFLOPS，已经不足后者的15%。

BIS一看没话说了，合理合规，就批准了出口许可。

但是英伟达耍了个心机：你只限制了我的总算力和性能密度，但没限制带宽，虽然H20大幅度阉割了算力，但在内存和带宽方面，却来了一次升级。

比如H100的内存是80GB，而H20的内存却达到了96GB，H100的带宽是3.35TB/s，而H20的带宽则达到了4TB/s。

这种大内存、大带宽设计，可满足大规模矩阵运算、深度学习等计算密集型任务对数据吞吐量的需求，尤其在处理高维度数据时能减少延迟，提升整体运算效率。

同时，H20还支持NVLink互联进行多卡协同，适用于需要高并发推理的场景（如长文本生成），所以在大语言模型推理方面，没有比H100差太多。

说实话，H20如果单纯看算力，其实已经不如国产的昇腾910B了，但就是靠着自己的内存和带宽优势，再加上CUDA生态的支持，允许多张卡高效协同工作，所以对国产AI企业来说，想玩大模型，首选的方案仍然是H20，就算知道它是阉割的，大家也只能一边骂一边买。

但是，不光是国内企业一边骂一边卖，美国的BIS又发现了黄老板钻的空子，于是今年4月份，BIS再次发布了新规，要求DRAM总带宽≥1400GB/s、I/O带宽≥1100GB/s，或两者总和≥1700GB/s的产品都受到管制。

这样一来，H20也没法卖了。一同受影响的，还有英特尔的Gaudi，以及AMD的MI308。

面对最新禁令，黄老板真的欲哭无泪，因为大模型的爆火，中国对H20的需求很大，H20排产计划很高，结果一纸禁令袭来，就算立即下令停产，相关的库存也有几十万块了，几十亿美元的投入了。

除了中国也卖不了其他国家，因为国外有能力买的直接就上H100和H200了，根本没人买阉了又阉的H20了。眼看这么多库存H20咋办？只能堆着等落后，变成垃圾。

黄老板，也只能开始在中美之间飞来飞去，开始了他的公关行动，最终终于说动了特朗普-当然就是使用钞能力。

4月14日，黄仁勋在白宫和特朗普共同宣布了一个消息，将在4年内在美国投资5000亿美元，联合台积电、富士康、纬创资通、安靠科技和硅精工业，将世界芯片制造中心从台湾转到美国，彻底改变芯片产业供应链。

一切差不多都谈妥了，结果更大的事情来了，4月份，是中美关税战打得一塌糊涂的时候，特朗普嘴硬好面子，这个时候解禁H20不合适。

直到6月10日，中美代表团在伦敦会谈，达成了框架性协议。从近一个月以来的动作来看，都是在落实这个框架协议，中国放松了稀土管制，而美国也放松了EDA、航空发动机和乙烷的管制，中美关系大大缓和，时机总算成熟了。

7月10日，黄仁勋再次前往白宫，终于得到了特朗普关于解禁H20的承诺。然后黄仁勋带着这份承诺，在7月11日飞往中国，参加链博会，7月14日，黄仁勋官宣H20解禁的消息。

上面就是英伟达从H100到H800，再到H20的历程了。再来看看国内的发展。

AI昇腾920芯片，基于中芯国际?6nm工艺打造，算力达900?TFLOPS，同时内存将升级到HBM3，单卡提供4TB/s的带宽，而且还可以通过达芬奇架构3.0进行硬件加速和软件协同，算是国产AI芯片中，唯一能媲美H100的了，并且在2025年4月，经过测试，昇腾训练率达到了H100的105%，听起来很厉害，不过需要注意的是，H100是2022年的芯片了，这三年时间里，2023年推出了H100的升级版H200，随后又更新到了GB200，今年3月又量产了更强的GB300，一颗GB300的理论算力约为45颗H100，算力异常强大，专为下一代万亿参数级大模型而生。

相比中国刚刚搞到H100的水平，这是多么巨大的一个差距？

目前，中美在AI领域的竞争如火如荼，最核心就是时间和产能了。这两个问题都是很难在短期突破的，据说NV又给中国定制了一款芯片B30，虽然B30算力比H20再降20%，内存从高速HBM3更换成了低速GDDR7，但能不能拿到BIS的出口许可证，仍是个未知数。

所有企业和国家都会提前布局和规划，不会等着靠外国给点我们用点，而且很多关键企业用国产AI芯片才保险，国家甚至给高额补贴让企业购买国产AI芯片。

为什么我会觉得很有意思呢？就是身处当前的时代洪流中，每一天都会有很多竞争，甚至可以说是战争，国内企业直接的商业大战，国际上大国斗争和博弈。从H20这块小小的芯片就可见一斑。

中国的芯片故事还有很多，要走的路也很长，未来谁是主角要随时间洪流不断角逐！

从H100到H800，再到H20，都经历了什么？看大国博弈！

相关推荐