近日,2025世界人工智能大会(WAIC)在上海成功举办,今年热度空前,场面十分火爆,一票难求。
期间,与非网记者走访了燧原科技展台,同样是人潮涌动。本次展出重点有两大方向,一个是燧原S60推理加速卡及其规模化应用,另一个是DeepSeek一体机系列。
燧原S60推理加速卡是面向数据中心大规模推理的具有高性价比的加速产品,满足大语言模型、搜索/广告/推荐及传统模型的需求,具有模型覆盖面广、易用性强、易迁移易部署等特点,可广泛应用于图像及文本生成等大模型、搜索与推荐、文本、图像及语音识别等主流推理场景。
燧原科技工程师向记者透露,其明星产品燧原S60推理加速卡在过去1-2年间已实现规模化商业落地。最新数据显示,该产品在互联网企业和全国各地智算中心的部署量已突破7万卡,成为支撑国产AI算力的重要基座。
记者在现场看到,头部互联网公司因体量庞大,需避免对美国供应商过度依赖带来的风险,因此开始逐步转向国产芯片。而燧原科技和腾讯有着深入的合作,累计已为腾讯提供数万张人工智能算力卡,涵盖生成式AI和传统判别式大模型两大方向。
在智算中心方向,与去年同期展会时的情况相比,燧原科技的产品落地部署也有了较大进展。2024 WAIC期间,燧原科技展出的是其二代产品在之江实验室、成都智算中心、宜昌点军智算中心(300P算力)和庆阳智算中心(50000P算力)等大型算力中心的落地情况。而今年,我们看到其第三代产品燧原S60已应用于庆阳万卡推理集群和无锡亿芯智算中心。
对此,工程师兴奋地告诉记者:“AIGC时代到来后,文生图、文生视频、图生图、图生视频受到市场热捧,于是美图构建了一个‘一键换装’的应用,并在今年春节期间爆火美国和东南亚等地,用户大量涌入,随之而来的是对算力需求的提升,此时美图租用了‘庆阳万卡推理集群’的算力,由于在建设之初就对美图这样的客户做了很好的需求调研、技术支撑和软件适配,所以很轻松地就满足了美图的弹性算力需求。”
取得如此成绩的背后,离不开国产芯片在供应稳定、应用经验丰富、性价比高方面的优势,以及其对 AI 大模型、传统模型 AIGC 等需求增长的良好适应。
对此,工程师举了一个例子,燧原S60的单卡典型功耗在300W左右,该功耗水平在当前大模型应用中较为典型,既能提供足够的算力支持大模型推理,又兼顾了性价比与能耗控制,避免了过高功耗带来的成本增加和部署复杂性。
值得一提的是,燧原S60采用的是DSA架构,而燧原展台周边围绕着很多GPGPU厂商,记者就大模型训练和推理中哪种架构更有优势向工程师请教。他的回答是,在处理特定领域的任务中,DSA会比GPGPU发挥出更大的优势,但随着技术的发展,两者正在不断融合以满足用户需求,导致DSA与GPGPU之间的界限变得逐渐模糊。
前面介绍了燧原S60推理加速卡及其规模化应用的情况,下面来讲一下燧原DeepSeek一体机的具体进展。
2025年初,燧原科技推出了DeepSeek一体机系列产品,产品规格覆盖从办公边缘一体机、标准一体机到算力中心级一体机,单机算力卡数包括:1卡、2卡、4卡、8卡、16卡、32卡等,客户可以根据自身的应用需求,选择不同的算力规格。
为了更好的适配政务、金融等目标场景的需求,燧原DeepSeek一体机配备了边缘液冷一体机,并支持主流国产CPU平台,并搭载基础软件,支持模型推理、资源管理配置等基础应用。
据悉,燧原DeepSeek一体机除了高效适配DeepSeek全量模型(含满血版和蒸馏版)外,与各主流大模型的全尺寸版本进行了良好适配和调优,包括:Llama、通义千问、混元、智谱、文心一言等大模型系列,以及各传统模型等。
关于落地进展,工程师向记者透露,当前燧原DeepSeek一体机已与近20家经销商建立了合作关系,通过对经销商的深入培训和技术方案赋能,积累了大量商业机会,获得了经销商和行业客户的认可。
不过,从另一工程师处获悉,当前燧原科技的营收主要来源还是互联网和智算中心,DeepSeek一体机的推广更多的是和生态合作伙伴一起在做市场推广和营销,还没大量出货。
来源: 与非网,作者: 夏珍,原文链接: /article/1870798.html