在2025年9月9日的AI Infra Summit上,英伟达创始人兼CEO黄仁勋再次成为全场焦点,正式发布了全新专用GPU——NVIDIA Rubin CPX。这款芯片专为处理百万token级别的代码生成和生成式视频应用而设计,被誉为“首款为超大上下文AI量身定制的CUDA GPU”。
Rubin CPX基于NVIDIA Rubin架构,采用单片设计,集成了强大的NVFP4计算资源。这款芯片提供高达30 PetaFLOPS的计算性能,并配备128GB的GDDR7内存。
与当前GB300 NVL72系统相比,Rubin CPX的注意力机制处理速度提升了整整3倍。这意味着模型在处理长达数百万token的上下文序列时能够保持高效,不会出现性能下降。该芯片采用512位内存总线,配合30 Gbps的GDDR7内存,可实现近1.8 TB/s的吞吐量。这样的带宽设计确保了Rubin CPX能够同时高效处理计算密集的预填充操作和内存密集的token生成阶段。
Rubin CPX的设计目标是解决当前AI推理中的一大瓶颈:长上下文处理。传统GPU在处理超长序列任务时面临性能急剧下降的问题。例如,在处理视频内容时,AI模型分析一小时的内容可能涉及上百万个token,这远远超出了传统GPU的计算极限。同样,在处理大规模代码库时,模型需要理解数十万行代码的上下文关系。Rubin CPX内置了视频子系统,包含四个NVENC和四个NVDEC块,消除了对独立编码器或解码器的依赖。这使得它在处理视频流AI工作负载时更加高效。
英伟达声称,Rubin CPX平台可实现30-50倍的投资回报率。这意味着每投资1亿美元,就能获得高达50亿美元的token收益。这一惊人的ROI来自于Rubin CPX在处理大规模上下文任务时的高效性能。它专门优化了AI推理任务,为高价值长上下文推理工作负载提供高吞吐量性能。黄仁勋此前曾说过“买得越多赚得越多”,而Rubin CPX正是这一理念的最新体现。它被称为新一代“印钞机”并非夸张。
Rubin CPX将被集成到Vera Rubin NVL144 CPX平台中。这个强大的系统整合了144个Rubin CPX GPU、144个Rubin GPU和36个Vera CPU。该平台在单机架内提供8 ExaFLOPS的AI算力、100TB高速内存和每秒1.7PB的内存带宽。其AI性能比NVIDIA GB300 NVL72系统高出7.5倍。平台采用高性能网络技术,包括能够实现1600G连接的ConnectX-9适配器和提供102.4T容量的Spectrum6交换机。大规模数据中心还可利用共封装光学器件实现高效扩展。
Rubin CPX的推出将推动多个AI应用领域的发展。在编程辅助方面,它能将AI编程助手从简单的代码生成工具升级为能够理解和优化大规模软件项目的复杂系统。对于视频生成和处理,Rubin CPX将视频解码、编码和长上下文推理处理集成在单芯片中,为视频搜索和高质量生成式视频等长时格式应用提供前所未有的能力。AI创新公司如Cursor、Runway和Magic已经开始探索Rubin CPX如何加速其应用。这些公司代表了代码生产力、生成式影像创作和大模型自主代理等前沿领域。
根据英伟达官方提供的渲染图,Rubin CPX GPU包含192个重复单元,很可能对应着192组SM(流式多处理器),这一数量与GB202相当。每颗Rubin CPX GPU大致对应约2083GB/s显存带宽。考虑到512位显存位宽的GeForce RTX 5090拥有1792GB/s的显存带宽,Rubin CPX GPU很可能同样具备512位的显存位宽。芯片采用GDDR7内存而非HBM,这被视为一种相对低成本的解决方案。这一选择也表明英伟达在追求性能的同时也在考虑成本效益。
英伟达推出Rubin CPX之际,AI推理市场正面临日益激烈的竞争。越来越多的竞争者试图制造专门用于AI推理的加速器,而不是用于AI训练。博通最近宣布从一家神秘新客户(很可能是OpenAI)获得了100亿美元的定制芯片订单。这表明AI巨头正在寻求减少对英伟达产品的依赖。然而,分析师Jim Awad认为:“关键要看博通和OpenAI接下来的执行情况,目前没人能在一夜之间夺走英伟达的生意。”即使失去部分市场份额,英伟达仍能因AI市场的整体扩张而保持增长。
根据英伟达公布的计划,Rubin CPX预计将在2026年底正式推出。这一时间点与英伟达整体的Rubin平台发布计划相符。英伟达通常在3月的GTC大会、5月的Computex和11月的SC超级计算大会上发布主力新产品。这次选择在9月的AI Infra Summit上发布Rubin CPX,反映了当前市场对AI编码和视频生成需求的紧迫性。2026年3月的GTC大会预计将正式推出Rubin GPU和Vera CPU两大产品,为年底的Rubin CPX全面上市铺平道路。Rubin CPX的发布不仅是英伟达产品线的一次扩展,更代表了AI计算架构的深刻变革。
随着AI应用从简单文本生成向多步推理代理演进,对长上下文处理的需求日益增长。
Rubin CPX正是英伟达为这一趋势提供的解决方案,它可能重新定义AI推理的经济学,让处理百万token级别的应用成为日常现实。