2026奇点智能技术大会深度解读报告
2026年奇点智能技术大会(SITS)在上海举行,聚焦AI技术拐点与产业路径。大会发布《AI原生软件研发成熟度模型AISMM白皮书》,提出面向大模型时代的工程操作系统,涵盖五大核心域(DataOps、ModelOps等)和六阶成熟度等级(L0-L5),并通过案例展示其落地效果(如交付周期压缩47%)。奇点智能研究院院长李建忠提出AI产业十二大趋势,包括计算范式重构、开发工具Agent化等,强调Ag
大会概览
会议时间:2026年4月17-18日
会议地点:上海环球港凯悦酒店
主办方:CSDN与奇点智能研究院
大会主题:从「全球机器学习技术大会」升级为「奇点智能技术大会」
参会规模:60+技术专家、50+演讲、1000+听众
核心定位:围绕技术拐点与产业路径展开集中讨论,为行业从业者提供更深层次的理解与思考路径
一、《AI原生软件研发成熟度模型AISMM白皮书》
1.1 白皮书概述
发布者:奇点智能研究院院长、CSDN高级副总裁 李建忠
核心定位:AISMM(AI-Specific Maturity Model)不是对CMMI的修修补补,而是面向大模型时代研发范式跃迁的工程操作系统。它将数据飞轮、模型迭代闭环、MLOps就绪度、人类反馈对齐(HFA)等关键能力嵌入到可度量、可审计、可进化的成熟度阶梯中。
五大章节结构:
- AI重塑软件全新范式的变局
- AISMM全景解读
- AI原生软件工程的核心变革剖析
- 企业现状与行业格局评估
- 技术趋势与价值主张的展望
1.2 AISMM vs CMMI 核心差异
| 能力维度 | CMMI Level 3 | AISMM Level 3 |
|---|---|---|
| 评估粒度 | 组织级流程域 | 场景级能力向量(如:retrieval_precision@k=5) |
| 演进触发 | 年度审计 | 在线A/B测试胜出信号 |
| 变更控制 | 代码分支合并需双人审批 | 模型权重更新、提示词集变更、数据采样策略调整均需三方联合签名 |
| 过程测量 | 需求覆盖率、缺陷密度 | 推理延迟P99稳定性、对抗样本拒识率、人工反馈采纳率 |
| 核心目标 | 流程合规 | 意图达成 |
1.3 AISMM五大核心域(Core Domains)
| 核心域 | 学术溯源 | 代表企业 | 落地场景 |
|---|---|---|---|
| DataOps | 2012年Databricks数据流水线工程化思想 | Netflix | 实时特征同步延迟<50ms |
| ModelOps | 2018年Gartner定义的模型生命周期管理框架 | Capital One | 日均模型部署200+ |
| EvalOps | ACL 2021《Benchmarking Foundation Models》 | - | 可复现评估范式 |
| GovOps | IEEE P7002数据治理标准 | - | 合规审计自动化 |
| LearnOps | 教育技术自适应学习理论+MLOps实时反馈 | - | 团队能力图谱演化 |
1.4 AISMM成熟度等级(L0-L5)
等级定义:L0–L5并非等距划分,而是依据127家金融机构AI系统运维审计数据识别出的6个关键拐点。
关键跃升阈值:
- L2→L3(自动化编排)跃迁成功率不足19%
- L4→L5(自主策略演化)跃迁成功率不足19%
各等级核心指标对比:
| 等级 | MTTR分布 | 策略生成延迟 | 合规覆盖度 |
|---|---|---|---|
| L2 | 12–47 min | N/A | ≤63% |
| L4 | 8–22 s | 3.2±0.7s | 91–96% |
| L5 | 0.8–4.3 s | <1.1s(P95) | 100%(动态映射) |
1.5 AISMM三阶收敛机制
大模型研发中,需求发散、接口漂移、环境异构导致系统熵持续攀升。AISMM通过三阶收敛抑制熵增:
| 阶段 | 收敛目标 | 典型手段 |
|---|---|---|
| 一阶(语义) | 接口意图一致性 | OpenAPI v3 + 语义注解 |
| 二阶(状态) | 跨环境执行确定性 | 容器镜像+权重快照绑定 |
| 三阶(演化) | 长期维护可追溯性 | 模型血缘图+变更影响分析 |
1.6 AISMM真实落地效果
案例:某全球TOP3云厂商
- 采用AISMM v2.1后:
- LLM服务交付周期压缩 47%
- 模型上线前人工审核环节减少 62%
- 关键缺陷逃逸率下降至 0.03%
- 核心动作:依据AISMM四级"自主调优"要求,重定义了SRE与ML工程师的协同契约
1.7 SITS2026七层能力模型(AI原生研发国家标准级评估体系)
| 层级 | 名称 | 核心功能 |
|---|---|---|
| 第1层 | 语义感知层 | 多模态意图解析,BERT变体槽位填充 |
| 第2层 | 推理编排层 | 动态工作流调度,时限约束拓扑排序 |
| 第3层 | 自治执行层 | 闭环反馈控制,自动扩缩容 |
| 第4层 | 可信演化层 | 版本化策略引擎,跨域签名验证 |
| 第5层 | 跨域协同层 | 联邦状态同步,策略对齐 |
| 第6层 | 价值对齐层 | 意图偏差率(IDR)监控 |
| 第7层 | 生态演进层 | 协变韧性指数(CRI)追踪 |
二、李建忠:AI产业十二大趋势
2.1 计算范式趋势(趋势1-4)
| 趋势 | 核心内容 | 研发落地关联 |
|---|---|---|
| 趋势1 | 推理算力的池化、异构与弹性调度 | 影响AI推理基础设施架构设计 |
| 趋势2 | 云计算服务模式深度重构:从IaaS/PaaS/SaaS到Token Factory/MaaS/AaaS | 开发模式从资源订阅转向能力订阅 |
| 趋势3 | 端云协同的AI计算架构走向成熟 | 影响模型部署策略与性能优化 |
| 趋势4 | Token经济学从应用技巧升维为基础设施工学 | 成本控制与效率优化成为核心工程能力 |
2.2 开发范式趋势(趋势5-8)
| 趋势 | 核心内容 | 研发落地关联 |
|---|---|---|
| 趋势5 | 自主软件工程的边界持续拓展 | Code Agent接管更多开发环节 |
| 趋势6 | Harness的成熟进化:手工配置→AI辅助→自动优化 | 从提示工程→上下文工程→驾驭工程 |
| 趋势7 | 开发工具和基础设施从人类中心走向Agent原生 | IDE、CI/CD、监控全面Agent化 |
| 趋势8 | 即时软件快速增长,柔性软件走向工程化成熟 | 软件形态从传统软件→柔性软件→即时软件 |
2.3 应用范式趋势(趋势9-12)
| 趋势 | 核心内容 | 研发落地关联 |
|---|---|---|
| 趋势9 | Agent成为用户交互第一入口,传统软件下游化 | 软件从"为人类设计"转向"为Agent设计" |
| 趋势10 | 生成式用户界面(GenUI)提供更个性化体验 | UI开发范式根本性变革 |
| 趋势11 | Agent将互联网从信息网络重构为行动网络 | 从信息检索到任务执行 |
| 趋势12 | 自然语言交互+Agent网络为多元设备提供人机界面 | 交互方式的范式转移 |
2.4 Agent对软件产业的双轮颠覆效应
李建忠指出,Agent正通过**“双轮颠覆效应”**重塑软件产业:
-
改变软件应用形态(Do What):
- Agent成为用户第一交互界面
- 传统软件被进一步"下游化",演变为可调用的工具
- 行业开始"为Agent去设计软件,而不是为人类设计软件"
-
颠覆软件开发方式(How Do):
- CLI比GUI对Agent更友好
- 需要构建面向Agent的能力体系:可调用工具/API、Skills、运行云端环境(沙箱)
三、王伟:AI大模型开源影响力榜单
3.1 评测体系概述
发布者:奇点智能研究院开源技术委员会主任、华东师范大学数据科学与工程学院教授 王伟
评测框架:突破单一性能维度局限,从数据、模型、测评与系统四个维度构建综合评价标准
评测规模:
- 53个核心指标
- 覆盖17个主流技术平台
- 采集13,541条有效链接
- 数据统计截止:2026年4月9日
开源地址:
- GitHub: https://github.com/brucecui0120/OSIR-LMTS
- GitCode: https://gitcode.com/brucec/OSIR-LMTS
3.2 四大维度评测详解
模型分榜:中国开源模型实力超越美国
| 模型类型 | 3月下载量占比 | 榜首模型 |
|---|---|---|
| 向量模型 | 38.4% | UKP Lab all-MiniLM-L6-v2(月下载2.02亿次) |
| 语言模型 | 31.0% | 阿里巴巴Qwen2.5-7B-Instruct(2338万次) |
| 多模态模型 | 17.1% | OpenAI clip-vit-base-patch32(1914万次) |
关键发现:
- 阿里巴巴以46个模型、覆盖5种模态的成绩占据绝对领先地位
- 中国在多模态模型领域的下载量已全面超越美国
- 得益于Qwen系列的持续迭代创新
数据分榜:中立机构领跑
| 机构 | 数据集数量 | 特色 |
|---|---|---|
| 北京智源人工智能研究院(BAAI) | 518个 | 多模态数据集195个、具身数据集199个 |
| 上海人工智能实验室 | - | 排名第二 |
| - | 排名第三 |
核心洞察:非营利、中立科研机构更愿意开放数据集,企业则更多将数据视为核心竞争力
系统分榜:工具链竞争成为关键战场
| 子指标 | 榜首机构 | 领先优势 |
|---|---|---|
| 算子库 | 北京智源人工智能研究院(BAAI) | 500个高性能通用算子 |
| 通信库 | 智源研究院 | FlagScale训练框架支撑 |
| AI编译器 | 智源研究院 | 底层支撑优势显著 |
| 深度学习框架 | 华为、百度、阿里等 | 7家机构覆盖4项 |
评测分榜:标准化进程加速
- 上海AI实验室:开源评测数据集从19个增长至34个
- 智源研究院:实现13倍增速突破
- 头部机构纷纷开放自研评测工具,模型优化周期缩短60%以上
3.3 综合榜单结果
| 排名 | 机构 | 核心优势 |
|---|---|---|
| 🥇 | 阿里巴巴 | 全链条能力领先,Qwen系列持续迭代 |
| 🥈 | 北京智源人工智能研究院 | 数据集数量第一,系统工具链完善 |
| 🥉 | 上海人工智能实验室 | 开源评测数据集快速增长 |
| 4 | Meta | Llama系列国际影响力 |
| 5 | - | - |
3.4 三大核心趋势
- 中国力量全面领跑:阿里巴巴、智源研究院、上海AI实验室 3家进入TOP5
- 全栈开源成为标配:单一模型开放已不够,数据、系统、评测协同开放才是生态核心
- 社区共建成为主流:评估方法开源、标准共建,全球AI正走向开放协同新阶段
四、「AI DSpace」AI开发者空间站
4.1 社区概述
定位:面向海内外技术专家的高密度AI开发者社区
发起方式:由多位技术专家以个人名义联合发起
核心目标:连接产业与学术、专家与初学者,推动更高密度的技术交流与实践协作
4.2 三大建设方向
方向一:社区驱动,开放参与
- 汇聚行业顶级技术专家
- 广泛吸纳在校生、初入职场者等新生力量
- 发挥连接器作用:搭建技术专家与入门从业者之间的沟通桥梁
- 采用"专家领衔、志愿者驱动"的参与机制
- 打造人人可贡献的开放生态
方向二:一站式内容与资源平台
- 硬核干货精选
- 线上线下立体化活动
- 本次大会发布的白皮书等独家资源
- 全方位支撑开发者学习与实践
方向三:全栈技术与产业版图覆盖
涵盖AI全链路多个领域:
| 领域 | 说明 |
|---|---|
| AI全链路 | 基础设施→模型工程→核心应用场景→运维体系→行业洞察 |
| 基础设施 | 底层技术支撑 |
| 模型工程 | 模型训练、优化、部署 |
| 重点场景 | 行业应用场景解析 |
| 前沿应用 | 最新技术应用实践 |
| 运维落地 | MLOps、AIOps实践 |
| 行业洞察 | 产业发展分析 |
五、AI工程落地:研发场景核心洞察
5.1 从AI-augmented到AI-native的范式跃迁
| 维度 | AI-augmented | AI-native |
|---|---|---|
| 控制流 | 静态分支 | 概率化路径选择 |
| 错误恢复 | 预设fallback | 生成式自修复 |
| 状态管理 | 应用层显式维护 | Agent内部持久化记忆(RAG+向量时序缓存) |
| 任务调度 | 中心化工作流引擎 | 自主目标分解与工具反射循环 |
| 核心特征 | 人类工程师为决策中心 | 模型嵌入系统骨架,驱动设计/验证/迭代闭环 |
5.2 AI原生研发的核心工程实践
需求工程阶段
- 自然语言需求→结构化契约:多智能体协同引擎自动生成数据契约与SLA声明
- 意图图谱构建:IntentNode→RequirementNode→TestScenario的完整链路
- 验证规则自动生成:基于LLM的意图-约束映射器
构建与部署阶段
- MCP编译器:模型权重与源码AST联合编译,输出统一IR包
- 零信任签名验证:模型哈希+编译器身份证书双因子签名
- 硬件TPM密钥背书:部署前CA链验证
运行时治理阶段
- 延迟感知在线策略决策:P99延迟预测+SLA余量动态加权
- 多目标优化:延迟、成本、SLA达标率综合权衡
- 实时反馈闭环:Prometheus指标+AI异常检测
5.3 六维成熟度评估框架(32项量化指标)
| 维度 | 指标数 | 核心指标示例 |
|---|---|---|
| 战略 | 6项 | AI战略对齐度、技术路线图清晰度 |
| 组织 | 5项 | AI团队规模、跨部门协同机制 |
| 流程 | 6项 | 变更审批自动化率、模型部署频率 |
| 技术 | 5项 | 跨云API一致性、LLM-Ops成熟度 |
| 数据 | 5项 | 元数据血缘覆盖率、数据新鲜度 |
| 安全 | 5项 | 对抗样本拒识率、合规覆盖度 |
5.4 AI驱动的测试工程
零样本测试生成
- 解析ONNX模型计算图,识别敏感张量节点
- 结合领域知识库生成语义等价对抗样本
- 输出Go语言测试桩,含覆盖率断言与可观测性埋点
TaaC(Test as a Code)效果对比
| 方法 | 漏洞检出率 | 误报率 | 平均响应延迟 |
|---|---|---|---|
| 传统规则匹配 | 41% | 29% | 120ms |
| TaaC语义模糊 | 78% | 8% | 310ms |
5.5 驾驭工程(Harness Engineering)的演进
AI领域概念迭代极快,从提示工程(Prompt Engineering)到上下文工程(Context Engineering),再到如今的驾驭工程(Harness Engineering)——即对AI智能体的协同与管理。
核心演进:
提示工程 → 上下文工程 → 驾驭工程
(Prompt) (Context) (Harness)
驾驭工程的关键能力:
- Agent能力编排与调度
- 多Agent协同治理
- 策略动态生成与执行
- 反馈闭环自动优化
六、大会嘉宾核心观点汇总
6.1 李建忠(奇点智能研究院院长)
核心观点:AI的Scaling Law正在经历持续进化——从Pre-training Scaling,到Post-training Scaling,再到Test-time Scaling,行业重心已明显转移。Agent Scaling的核心是在构建一个多步骤、自主运行的跨系统闭环,其最终衡量标准是任务完成度。
预测:传统软件乃至整个SaaS领域的市值确实都在下滑,这是软件行业的根本性变革。传统软件会被即时软件、个性化智能体等新型形态大量替代与蚕食。
6.2 黄非(荣耀终端AI首席科学家)
核心观点:单靠模型无法创造稳定的商业化闭环,真正的跨越在于从"模型决定一切"走向"模型与系统协同",并最终迈向以人为中心的增强人类智能(AHI)。
代码是大模型最早也是最适合落地的应用场景:第一,代码运行具备低成本的模拟与验证环境;第二,GitHub等平台提供了大量高质量开源代码作为学习素材;第三,编译报错或运行结果反馈能提供丰富的信号用于模型优化。
6.3 周俊(蚂蚁集团副总裁)
核心观点:无论是国外顶尖大模型公司,还是国内厂商,在很多关键问题上并没有形成一致判断,大量"非共识"并存,这恰恰构成了AGI时代比较有趣的地方,把很多非共识慢慢做成了共识。
6.4 陈恺(上海人工智能实验室青年领军科学家)
核心观点:目前AI领域的核心发展方向已逐渐转向智能体和长程推理能力的提升。
6.5 王伟(华东师范大学教授)
核心观点:人们往往聚焦于模型本身的能力。然而,一个开源大模型的真正影响力,是由其背后的数据、模型、系统、评测四大方面共同决定的。这即是本次榜单评估的核心理念——将一个模型的技术体系作为整体进行评价。
七、大会分论坛主题一览
| 分论坛 | 核心议题 |
|---|---|
| 大语言模型技术演进 | LLM最新技术进展、推理能力提升 |
| 多模态与世界模型 | 视觉-语言-音频多模态融合 |
| AI计算平台与性能优化 | GPU/NPU优化、推理加速 |
| AI原生软件研发与氛围编程 | AI辅助编码最佳实践 |
| 智能体系统与工程 | Agent架构、编排、协作 |
| AI原生应用创新与开发实践 | 落地案例分享 |
| 智能体使能的DevOps | AIOps、自动化运维 |
| 大模型系统架构 | 分布式训练、推理架构 |
| AI Infra基础设施与运维 | MLOps平台建设 |
| 具身智能与智能硬件 | 机器人、自动驾驶 |
| 开源模型与框架 | 开源生态建设 |
| AI+行业落地实践 | 金融、医疗、制造应用 |
八、大会核心演讲嘉宾(部分)
| 嘉宾 | 机构 | 演讲主题 |
|---|---|---|
| 李建忠 | 奇点智能研究院/CSDN | Agent重塑软件与互联网产业新范式 |
| 黄非 | 荣耀终端 | 跨越周期:人工智能的演进和未来 |
| 周俊 | 蚂蚁集团 | 从语言到推理:百灵大模型的AGI探索 |
| 陈恺 | 上海人工智能实验室 | 万亿参数科学多模态大模型: Intern-S1-Pro技术解析 |
| 李永彬 | 阿里/通义灵码 | 从辅助编程到自主智能:Qoder在复杂软件工程中的Agentic演进与实践 |
| 张俊林 | 新浪微博 | 大模型在线策略蒸馏 |
| 王伟 | 华东师范大学/奇点研究院 | AI大模型技术体系综合开源影响力榜单发布 |
九、关键结论与建议
9.1 对AI工程落地的关键启示
- 范式转变已发生:从"能不能做"的能力验证,走向"如何规模化落地"的系统工程
- Agent成为新入口:从单点模型能力比拼,转向以Agent为核心的系统性重构
- 研发流程需重构:企业需重构研发流程以适应新的工作方式和提升组织效率
- 全栈能力成竞争核心:单一模型开放已不够,数据、系统、评测协同开放才是生态核心
9.2 对开发者的建议
- 拥抱AI原生思维:从"为人类设计软件"转向"为Agent设计软件"
- 掌握驾驭工程:从提示工程→上下文工程→驾驭工程的能力升级
- 关注即时软件:即时生成、即用即抛的低成本个性化软件是新方向
- 强化系统能力:更强调问题定义、系统理解以及与AI协同的能力
9.3 对企业的建议
- 引入AISMM评估框架:系统评估自身AI研发成熟度,制定跃迁路径
- 关注六大关键维度:战略、组织、流程、技术、数据、安全
- 重视数据飞轮:构建高质量数据管道,实现模型迭代闭环
- 拥抱社区共建:参与开源评测体系,借助行业共识推动标准发展
附录:相关资源链接
- 大会官网:https://ml-summit.org/
- AISMM评测数据集GitHub:https://github.com/brucecui0120/OSIR-LMTS
- AISMM评测数据集GitCode:https://gitcode.com/brucec/OSIR-LMTS
- 白皮书获取:关注CSDN公众号或官网获取完整白皮书
报告整理时间:2026年4月
信息来源:2026奇点智能技术大会官方发布及CSDN报道
openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构
更多推荐

所有评论(0)