2026年6月16日,第32届中国国际金融展在上海世博展览馆开幕。在这场金融科技的年度盛会上,一组数据让整个行业为之侧目——平头哥自研真武AI芯片在金融行业的部署规模已突破10万卡,覆盖银行、证券、保险、基金等超过150家主流机构。截至2026年5月,真武系列芯片已累计出货56万片,广泛应用于财富管理、信贷风控、投研投顾、进件识别、合规监控等核心场景-。

与此同时,海光信息已在90%以上的金融场景实现算力覆盖。中国邮政储蓄银行副行长牛新庄在展会上透露,大模型已向银行业全面开放共享,部署成本降低80%以上

三年前,国产AI芯片在金融行业还只是一个“备胎”选项。如今,它正在成为银行、证券、保险机构的“首选大脑”。这背后,是一场从芯片到云、从算力到应用的全栈式变革。

一、从“备胎”到“主力”:10万卡背后的信任跃迁

三年前,金融机构对国产AI芯片的态度可以用四个字概括:能用,但不敢用。

金融行业对稳定性的要求近乎苛刻。一笔交易延迟几毫秒可能造成数百万损失,一个风控模型的误判可能引发系统性风险。彼时,国产AI芯片虽然在性能上逐步追赶,但软件栈不成熟、生态不完善、迁移成本高昂——金融机构宁愿支付溢价采购英伟达,也不愿在核心业务上冒险。

2026年6月16日,这个局面被彻底改写。

平头哥真武AI芯片的10万卡部署不是实验室里的“概念验证”,而是真实跑在银行信贷审批、券商投研分析、保险公司核保理赔等核心生产环境中的算力。据IDC最新发布的《中国金融AI全栈云市场(2025下半年)跟踪》显示,真武AI芯片2025年下半年收入环比上半年增长400%,在Top5国产芯片厂商中增速第一。

海光信息副总裁吴宗友在金融展现场表示,在国家金融信创产业从通用算力到国产化算力的过渡中,海光很好地支撑了自主化算力的发展。海光信息凭借“CPU+DCU”双芯战略,通过开放HSL总线协议和自研软件栈,打造了全栈式国产算力解决方案-。

这种转变的驱动力来自两个方向:

技术端——国产芯片的软件栈日趋成熟。过去,迁移到国产芯片意味着重写代码、重新适配框架,工作量巨大。如今,海光DCU凭借对CUDA生态的良好兼容性,使企业无需重构代码即可运行主流AI框架与大模型-。平头哥则依托真武芯片、千问大模型、点金通用智能体的深度协同,以“芯-云-模-智”全栈能力为金融机构提供从算力底座到Agent应用的完整解决方案。

外部端——英伟达供应的不确定性持续加剧。从芯片出口管制到高端GPU禁运,外部供应的“断供风险”已从理论推演变为现实威胁。金融机构别无选择,必须加速国产替代。

海光信息2026年一季度营收同比增长68%-;2025年公司高端处理器产销率达98.84%-。工商银行2025年度海光芯片服务器采购项目规模或达30亿元-。这些数字说明:金融机构不再是被迫选择国产芯片,而是主动拥抱。

正如行业观察者所言,国产CPU已完成从“可用”到“好用”的质变-。在金融机构的实际负载测试中,交易处理延迟与国外x86平台差距控制在5%以内,使得金融机构在招标文件中直接指定国产平台,并非出于政策压力,而是基于真实性能验证后的主动选择-。

二、成本降低80%:平价算力如何改写游戏规则

如果说10万卡是“量”的突破,那么部署成本降低80% 则是“质”的飞跃。

邮储银行的实践提供了一个极具说服力的样本。为破解大模型算力消耗高、部署周期长、资源利用率低、落地成本高的规模化推广难题,邮储银行构建模型资源池,立足国产算力生态,搭建全栈协同工程体系-。通过系统性的架构创新与工程优化,有效推动金融大模型实现低成本、高效率的规模化应用-。

80%的成本降幅是如何实现的?拆解来看,至少来自三个层面:

第一,芯片本身的性价比优势。 国产AI芯片在同等算力水平下,采购成本显著低于进口芯片。但这只是最表层的原因。

第二,云原生调度带来的资源效率革命。 传统模式下,金融机构为每个AI应用单独采购GPU服务器,资源利用率极低——大部分时间算力闲置,高峰期又不够用。云原生架构通过弹性资源供给与按需付费模式,实现了算力的池化和动态调度-。低峰期释放资源给其他业务,高峰期自动扩容-。这种“削峰填谷”的能力,将GPU利用率从不足30%提升至70%以上。

第三,中间件与软件栈的智能化升级。 国产芯片的软件栈日趋成熟,金融机构不再需要为每款芯片单独开发驱动和适配层。统一的计算调度平台可以纳管平头哥、海光、昇腾等多类国产AI加速卡-,大幅降低了开发和运维成本。

这场成本革命的意义,远不止于“省钱”。

它改变了金融科技竞争的底层逻辑。 过去,AI能力是大型金融机构的“专利”——只有国有大行和头部股份制银行才有预算采购昂贵的GPU集群、组建庞大的AI团队。如今,部署成本降低80%意味着,城商行、农商行、甚至村镇银行都有能力接入大模型能力-。AI不再是大行的“护城河”,而是全行业的“基础设施”。

它加速了AI从“锦上添花”到“核心驱动”的转变。 当算力成本足够低,金融机构就不再纠结于“这个场景值不值得上AI”,而是思考“哪个场景还不能上AI”。2026年金融展上,沐曦股份高级副总裁孙国梁观察到,金融行业开始将部分决策交给AI系统——风险管控、报表分析、金融交易、场景化服务,AI正在从“辅助工具”变为“决策主体”。

三、从芯片到应用:全栈国产化的最后一公里

10万卡部署和80%成本降幅,标志着国产AI算力在金融行业完成了从“可用”到“好用”的跨越。但故事还没有结束——真正的挑战在于“全栈”。

金融AI的落地不是“买几块芯片”就能解决的。从底层的CPU和AI芯片,到操作系统和数据库,再到中间件和上层应用,每一个环节都必须是国产的、自主的、可控的-。任何一个环节的“卡脖子”,都可能让整个系统功亏一篑。

2026年金融展的一个显著变化是,主办方首次引入“生态”概念布展——头部科技企业的展台都带上了上下游合作伙伴一起亮相,从底层芯片、操作系统到上层AI应用、场景解决方案,展出一套完整的生态链-。

这正是金融信创从“替代”走向“创新”与“生态构建”的标志-。金融机构不再满足于“换掉某一块硬件”,而是追求“打造一个完整的国产化技术栈”——一个从芯片到应用、从算力到算法、从基础设施到业务场景都自主可控的数字化基座。

四、结语

2026年6月16日,上海世博展览馆。

当邮储银行副行长说出“部署成本降低80%以上”时,当阿里云高管宣布“真武芯片突破10万卡”时-——这些数字背后是一个正在发生的事实:中国金融业的“大脑”,正在从进口转向国产。

这不是一场简单的“替代”,而是一次深刻的重构。国产芯片不再是“备胎”,而是金融机构主动选择的“主力”;国产算力不再是“将就”,而是驱动业务创新的“引擎”;国产技术栈不再是“政策要求”,而是商业竞争力的“核心资产”。

从10万卡开始,中国金融业正在重新定义自己的技术底座。这条路,才刚刚开始。

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐