大会概览

会议时间:2026年4月17-18日
会议地点:上海环球港凯悦酒店
主办方:CSDN与奇点智能研究院
大会主题:从「全球机器学习技术大会」升级为「奇点智能技术大会」
参会规模:60+技术专家、50+演讲、1000+听众
核心定位:围绕技术拐点与产业路径展开集中讨论,为行业从业者提供更深层次的理解与思考路径


一、《AI原生软件研发成熟度模型AISMM白皮书》

1.1 白皮书概述

发布者:奇点智能研究院院长、CSDN高级副总裁 李建忠

核心定位:AISMM(AI-Specific Maturity Model)不是对CMMI的修修补补,而是面向大模型时代研发范式跃迁的工程操作系统。它将数据飞轮、模型迭代闭环、MLOps就绪度、人类反馈对齐(HFA)等关键能力嵌入到可度量、可审计、可进化的成熟度阶梯中。

五大章节结构

  1. AI重塑软件全新范式的变局
  2. AISMM全景解读
  3. AI原生软件工程的核心变革剖析
  4. 企业现状与行业格局评估
  5. 技术趋势与价值主张的展望

1.2 AISMM vs CMMI 核心差异

能力维度 CMMI Level 3 AISMM Level 3
评估粒度 组织级流程域 场景级能力向量(如:retrieval_precision@k=5)
演进触发 年度审计 在线A/B测试胜出信号
变更控制 代码分支合并需双人审批 模型权重更新、提示词集变更、数据采样策略调整均需三方联合签名
过程测量 需求覆盖率、缺陷密度 推理延迟P99稳定性、对抗样本拒识率、人工反馈采纳率
核心目标 流程合规 意图达成

1.3 AISMM五大核心域(Core Domains)

核心域 学术溯源 代表企业 落地场景
DataOps 2012年Databricks数据流水线工程化思想 Netflix 实时特征同步延迟<50ms
ModelOps 2018年Gartner定义的模型生命周期管理框架 Capital One 日均模型部署200+
EvalOps ACL 2021《Benchmarking Foundation Models》 - 可复现评估范式
GovOps IEEE P7002数据治理标准 - 合规审计自动化
LearnOps 教育技术自适应学习理论+MLOps实时反馈 - 团队能力图谱演化

1.4 AISMM成熟度等级(L0-L5)

等级定义:L0–L5并非等距划分,而是依据127家金融机构AI系统运维审计数据识别出的6个关键拐点。

关键跃升阈值

  • L2→L3(自动化编排)跃迁成功率不足19%
  • L4→L5(自主策略演化)跃迁成功率不足19%

各等级核心指标对比

等级 MTTR分布 策略生成延迟 合规覆盖度
L2 12–47 min N/A ≤63%
L4 8–22 s 3.2±0.7s 91–96%
L5 0.8–4.3 s <1.1s(P95) 100%(动态映射)

1.5 AISMM三阶收敛机制

大模型研发中,需求发散、接口漂移、环境异构导致系统熵持续攀升。AISMM通过三阶收敛抑制熵增:

阶段 收敛目标 典型手段
一阶(语义) 接口意图一致性 OpenAPI v3 + 语义注解
二阶(状态) 跨环境执行确定性 容器镜像+权重快照绑定
三阶(演化) 长期维护可追溯性 模型血缘图+变更影响分析

1.6 AISMM真实落地效果

案例:某全球TOP3云厂商

  • 采用AISMM v2.1后:
    • LLM服务交付周期压缩 47%
    • 模型上线前人工审核环节减少 62%
    • 关键缺陷逃逸率下降至 0.03%
  • 核心动作:依据AISMM四级"自主调优"要求,重定义了SRE与ML工程师的协同契约

1.7 SITS2026七层能力模型(AI原生研发国家标准级评估体系)

层级 名称 核心功能
第1层 语义感知层 多模态意图解析,BERT变体槽位填充
第2层 推理编排层 动态工作流调度,时限约束拓扑排序
第3层 自治执行层 闭环反馈控制,自动扩缩容
第4层 可信演化层 版本化策略引擎,跨域签名验证
第5层 跨域协同层 联邦状态同步,策略对齐
第6层 价值对齐层 意图偏差率(IDR)监控
第7层 生态演进层 协变韧性指数(CRI)追踪

二、李建忠:AI产业十二大趋势

2.1 计算范式趋势(趋势1-4)

趋势 核心内容 研发落地关联
趋势1 推理算力的池化、异构与弹性调度 影响AI推理基础设施架构设计
趋势2 云计算服务模式深度重构:从IaaS/PaaS/SaaS到Token Factory/MaaS/AaaS 开发模式从资源订阅转向能力订阅
趋势3 端云协同的AI计算架构走向成熟 影响模型部署策略与性能优化
趋势4 Token经济学从应用技巧升维为基础设施工学 成本控制与效率优化成为核心工程能力

2.2 开发范式趋势(趋势5-8)

趋势 核心内容 研发落地关联
趋势5 自主软件工程的边界持续拓展 Code Agent接管更多开发环节
趋势6 Harness的成熟进化:手工配置→AI辅助→自动优化 从提示工程→上下文工程→驾驭工程
趋势7 开发工具和基础设施从人类中心走向Agent原生 IDE、CI/CD、监控全面Agent化
趋势8 即时软件快速增长,柔性软件走向工程化成熟 软件形态从传统软件→柔性软件→即时软件

2.3 应用范式趋势(趋势9-12)

趋势 核心内容 研发落地关联
趋势9 Agent成为用户交互第一入口,传统软件下游化 软件从"为人类设计"转向"为Agent设计"
趋势10 生成式用户界面(GenUI)提供更个性化体验 UI开发范式根本性变革
趋势11 Agent将互联网从信息网络重构为行动网络 从信息检索到任务执行
趋势12 自然语言交互+Agent网络为多元设备提供人机界面 交互方式的范式转移

2.4 Agent对软件产业的双轮颠覆效应

李建忠指出,Agent正通过**“双轮颠覆效应”**重塑软件产业:

  1. 改变软件应用形态(Do What)

    • Agent成为用户第一交互界面
    • 传统软件被进一步"下游化",演变为可调用的工具
    • 行业开始"为Agent去设计软件,而不是为人类设计软件"
  2. 颠覆软件开发方式(How Do)

    • CLI比GUI对Agent更友好
    • 需要构建面向Agent的能力体系:可调用工具/API、Skills、运行云端环境(沙箱)

三、王伟:AI大模型开源影响力榜单

3.1 评测体系概述

发布者:奇点智能研究院开源技术委员会主任、华东师范大学数据科学与工程学院教授 王伟

评测框架:突破单一性能维度局限,从数据、模型、测评与系统四个维度构建综合评价标准

评测规模

  • 53个核心指标
  • 覆盖17个主流技术平台
  • 采集13,541条有效链接
  • 数据统计截止:2026年4月9日

开源地址

  • GitHub: https://github.com/brucecui0120/OSIR-LMTS
  • GitCode: https://gitcode.com/brucec/OSIR-LMTS

3.2 四大维度评测详解

模型分榜:中国开源模型实力超越美国
模型类型 3月下载量占比 榜首模型
向量模型 38.4% UKP Lab all-MiniLM-L6-v2(月下载2.02亿次)
语言模型 31.0% 阿里巴巴Qwen2.5-7B-Instruct(2338万次)
多模态模型 17.1% OpenAI clip-vit-base-patch32(1914万次)

关键发现

  • 阿里巴巴以46个模型、覆盖5种模态的成绩占据绝对领先地位
  • 中国在多模态模型领域的下载量已全面超越美国
  • 得益于Qwen系列的持续迭代创新
数据分榜:中立机构领跑
机构 数据集数量 特色
北京智源人工智能研究院(BAAI) 518个 多模态数据集195个、具身数据集199个
上海人工智能实验室 - 排名第二
Google - 排名第三

核心洞察:非营利、中立科研机构更愿意开放数据集,企业则更多将数据视为核心竞争力

系统分榜:工具链竞争成为关键战场
子指标 榜首机构 领先优势
算子库 北京智源人工智能研究院(BAAI) 500个高性能通用算子
通信库 智源研究院 FlagScale训练框架支撑
AI编译器 智源研究院 底层支撑优势显著
深度学习框架 华为、百度、阿里等 7家机构覆盖4项
评测分榜:标准化进程加速
  • 上海AI实验室:开源评测数据集从19个增长至34个
  • 智源研究院:实现13倍增速突破
  • 头部机构纷纷开放自研评测工具,模型优化周期缩短60%以上

3.3 综合榜单结果

排名 机构 核心优势
🥇 阿里巴巴 全链条能力领先,Qwen系列持续迭代
🥈 北京智源人工智能研究院 数据集数量第一,系统工具链完善
🥉 上海人工智能实验室 开源评测数据集快速增长
4 Meta Llama系列国际影响力
5 - -

3.4 三大核心趋势

  1. 中国力量全面领跑:阿里巴巴、智源研究院、上海AI实验室 3家进入TOP5
  2. 全栈开源成为标配:单一模型开放已不够,数据、系统、评测协同开放才是生态核心
  3. 社区共建成为主流:评估方法开源、标准共建,全球AI正走向开放协同新阶段

四、「AI DSpace」AI开发者空间站

4.1 社区概述

定位:面向海内外技术专家的高密度AI开发者社区
发起方式:由多位技术专家以个人名义联合发起
核心目标:连接产业与学术、专家与初学者,推动更高密度的技术交流与实践协作

4.2 三大建设方向

方向一:社区驱动,开放参与
  • 汇聚行业顶级技术专家
  • 广泛吸纳在校生、初入职场者等新生力量
  • 发挥连接器作用:搭建技术专家与入门从业者之间的沟通桥梁
  • 采用"专家领衔、志愿者驱动"的参与机制
  • 打造人人可贡献的开放生态
方向二:一站式内容与资源平台
  • 硬核干货精选
  • 线上线下立体化活动
  • 本次大会发布的白皮书等独家资源
  • 全方位支撑开发者学习与实践
方向三:全栈技术与产业版图覆盖

涵盖AI全链路多个领域:

领域 说明
AI全链路 基础设施→模型工程→核心应用场景→运维体系→行业洞察
基础设施 底层技术支撑
模型工程 模型训练、优化、部署
重点场景 行业应用场景解析
前沿应用 最新技术应用实践
运维落地 MLOps、AIOps实践
行业洞察 产业发展分析

五、AI工程落地:研发场景核心洞察

5.1 从AI-augmented到AI-native的范式跃迁

维度 AI-augmented AI-native
控制流 静态分支 概率化路径选择
错误恢复 预设fallback 生成式自修复
状态管理 应用层显式维护 Agent内部持久化记忆(RAG+向量时序缓存)
任务调度 中心化工作流引擎 自主目标分解与工具反射循环
核心特征 人类工程师为决策中心 模型嵌入系统骨架,驱动设计/验证/迭代闭环

5.2 AI原生研发的核心工程实践

需求工程阶段
  • 自然语言需求→结构化契约:多智能体协同引擎自动生成数据契约与SLA声明
  • 意图图谱构建:IntentNode→RequirementNode→TestScenario的完整链路
  • 验证规则自动生成:基于LLM的意图-约束映射器
构建与部署阶段
  • MCP编译器:模型权重与源码AST联合编译,输出统一IR包
  • 零信任签名验证:模型哈希+编译器身份证书双因子签名
  • 硬件TPM密钥背书:部署前CA链验证
运行时治理阶段
  • 延迟感知在线策略决策:P99延迟预测+SLA余量动态加权
  • 多目标优化:延迟、成本、SLA达标率综合权衡
  • 实时反馈闭环:Prometheus指标+AI异常检测

5.3 六维成熟度评估框架(32项量化指标)

维度 指标数 核心指标示例
战略 6项 AI战略对齐度、技术路线图清晰度
组织 5项 AI团队规模、跨部门协同机制
流程 6项 变更审批自动化率、模型部署频率
技术 5项 跨云API一致性、LLM-Ops成熟度
数据 5项 元数据血缘覆盖率、数据新鲜度
安全 5项 对抗样本拒识率、合规覆盖度

5.4 AI驱动的测试工程

零样本测试生成
  • 解析ONNX模型计算图,识别敏感张量节点
  • 结合领域知识库生成语义等价对抗样本
  • 输出Go语言测试桩,含覆盖率断言与可观测性埋点
TaaC(Test as a Code)效果对比
方法 漏洞检出率 误报率 平均响应延迟
传统规则匹配 41% 29% 120ms
TaaC语义模糊 78% 8% 310ms

5.5 驾驭工程(Harness Engineering)的演进

AI领域概念迭代极快,从提示工程(Prompt Engineering)上下文工程(Context Engineering),再到如今的驾驭工程(Harness Engineering)——即对AI智能体的协同与管理。

核心演进

提示工程 → 上下文工程 → 驾驭工程
  (Prompt)    (Context)    (Harness)

驾驭工程的关键能力

  • Agent能力编排与调度
  • 多Agent协同治理
  • 策略动态生成与执行
  • 反馈闭环自动优化

六、大会嘉宾核心观点汇总

6.1 李建忠(奇点智能研究院院长)

核心观点:AI的Scaling Law正在经历持续进化——从Pre-training Scaling,到Post-training Scaling,再到Test-time Scaling,行业重心已明显转移。Agent Scaling的核心是在构建一个多步骤、自主运行的跨系统闭环,其最终衡量标准是任务完成度

预测:传统软件乃至整个SaaS领域的市值确实都在下滑,这是软件行业的根本性变革。传统软件会被即时软件、个性化智能体等新型形态大量替代与蚕食。

6.2 黄非(荣耀终端AI首席科学家)

核心观点:单靠模型无法创造稳定的商业化闭环,真正的跨越在于从"模型决定一切"走向"模型与系统协同",并最终迈向以人为中心的增强人类智能(AHI)

代码是大模型最早也是最适合落地的应用场景:第一,代码运行具备低成本的模拟与验证环境;第二,GitHub等平台提供了大量高质量开源代码作为学习素材;第三,编译报错或运行结果反馈能提供丰富的信号用于模型优化。

6.3 周俊(蚂蚁集团副总裁)

核心观点:无论是国外顶尖大模型公司,还是国内厂商,在很多关键问题上并没有形成一致判断,大量"非共识"并存,这恰恰构成了AGI时代比较有趣的地方,把很多非共识慢慢做成了共识。

6.4 陈恺(上海人工智能实验室青年领军科学家)

核心观点:目前AI领域的核心发展方向已逐渐转向智能体和长程推理能力的提升。

6.5 王伟(华东师范大学教授)

核心观点:人们往往聚焦于模型本身的能力。然而,一个开源大模型的真正影响力,是由其背后的数据、模型、系统、评测四大方面共同决定的。这即是本次榜单评估的核心理念——将一个模型的技术体系作为整体进行评价。


七、大会分论坛主题一览

分论坛 核心议题
大语言模型技术演进 LLM最新技术进展、推理能力提升
多模态与世界模型 视觉-语言-音频多模态融合
AI计算平台与性能优化 GPU/NPU优化、推理加速
AI原生软件研发与氛围编程 AI辅助编码最佳实践
智能体系统与工程 Agent架构、编排、协作
AI原生应用创新与开发实践 落地案例分享
智能体使能的DevOps AIOps、自动化运维
大模型系统架构 分布式训练、推理架构
AI Infra基础设施与运维 MLOps平台建设
具身智能与智能硬件 机器人、自动驾驶
开源模型与框架 开源生态建设
AI+行业落地实践 金融、医疗、制造应用

八、大会核心演讲嘉宾(部分)

嘉宾 机构 演讲主题
李建忠 奇点智能研究院/CSDN Agent重塑软件与互联网产业新范式
黄非 荣耀终端 跨越周期:人工智能的演进和未来
周俊 蚂蚁集团 从语言到推理:百灵大模型的AGI探索
陈恺 上海人工智能实验室 万亿参数科学多模态大模型: Intern-S1-Pro技术解析
李永彬 阿里/通义灵码 从辅助编程到自主智能:Qoder在复杂软件工程中的Agentic演进与实践
张俊林 新浪微博 大模型在线策略蒸馏
王伟 华东师范大学/奇点研究院 AI大模型技术体系综合开源影响力榜单发布

九、关键结论与建议

9.1 对AI工程落地的关键启示

  1. 范式转变已发生:从"能不能做"的能力验证,走向"如何规模化落地"的系统工程
  2. Agent成为新入口:从单点模型能力比拼,转向以Agent为核心的系统性重构
  3. 研发流程需重构:企业需重构研发流程以适应新的工作方式和提升组织效率
  4. 全栈能力成竞争核心:单一模型开放已不够,数据、系统、评测协同开放才是生态核心

9.2 对开发者的建议

  1. 拥抱AI原生思维:从"为人类设计软件"转向"为Agent设计软件"
  2. 掌握驾驭工程:从提示工程→上下文工程→驾驭工程的能力升级
  3. 关注即时软件:即时生成、即用即抛的低成本个性化软件是新方向
  4. 强化系统能力:更强调问题定义、系统理解以及与AI协同的能力

9.3 对企业的建议

  1. 引入AISMM评估框架:系统评估自身AI研发成熟度,制定跃迁路径
  2. 关注六大关键维度:战略、组织、流程、技术、数据、安全
  3. 重视数据飞轮:构建高质量数据管道,实现模型迭代闭环
  4. 拥抱社区共建:参与开源评测体系,借助行业共识推动标准发展

附录:相关资源链接

  • 大会官网:https://ml-summit.org/
  • AISMM评测数据集GitHub:https://github.com/brucecui0120/OSIR-LMTS
  • AISMM评测数据集GitCode:https://gitcode.com/brucec/OSIR-LMTS
  • 白皮书获取:关注CSDN公众号或官网获取完整白皮书

报告整理时间:2026年4月
信息来源:2026奇点智能技术大会官方发布及CSDN报道

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐