2026奇点智能技术大会深度解读报告

2026年奇点智能技术大会（SITS）在上海举行，聚焦AI技术拐点与产业路径。大会发布《AI原生软件研发成熟度模型AISMM白皮书》，提出面向大模型时代的工程操作系统，涵盖五大核心域（DataOps、ModelOps等）和六阶成熟度等级（L0-L5），并通过案例展示其落地效果（如交付周期压缩47%）。奇点智能研究院院长李建忠提出AI产业十二大趋势，包括计算范式重构、开发工具Agent化等，强调Ag

qqxhb

443人浏览 · 2026-04-24 09:30:26

qqxhb · 2026-04-24 09:30:26 发布

大会概览

会议时间：2026年4月17-18日
会议地点：上海环球港凯悦酒店
主办方：CSDN与奇点智能研究院
大会主题：从「全球机器学习技术大会」升级为「奇点智能技术大会」
参会规模：60+技术专家、50+演讲、1000+听众
核心定位：围绕技术拐点与产业路径展开集中讨论，为行业从业者提供更深层次的理解与思考路径

一、《AI原生软件研发成熟度模型AISMM白皮书》

1.1 白皮书概述

发布者：奇点智能研究院院长、CSDN高级副总裁李建忠

核心定位：AISMM（AI-Specific Maturity Model）不是对CMMI的修修补补，而是面向大模型时代研发范式跃迁的工程操作系统。它将数据飞轮、模型迭代闭环、MLOps就绪度、人类反馈对齐（HFA）等关键能力嵌入到可度量、可审计、可进化的成熟度阶梯中。

五大章节结构：

AI重塑软件全新范式的变局
AISMM全景解读
AI原生软件工程的核心变革剖析
企业现状与行业格局评估
技术趋势与价值主张的展望

1.2 AISMM vs CMMI 核心差异

能力维度	CMMI Level 3	AISMM Level 3
评估粒度	组织级流程域	场景级能力向量（如：retrieval_precision@k=5）
演进触发	年度审计	在线A/B测试胜出信号
变更控制	代码分支合并需双人审批	模型权重更新、提示词集变更、数据采样策略调整均需三方联合签名
过程测量	需求覆盖率、缺陷密度	推理延迟P99稳定性、对抗样本拒识率、人工反馈采纳率
核心目标	流程合规	意图达成

1.3 AISMM五大核心域（Core Domains）

核心域	学术溯源	代表企业	落地场景
DataOps	2012年Databricks数据流水线工程化思想	Netflix	实时特征同步延迟<50ms
ModelOps	2018年Gartner定义的模型生命周期管理框架	Capital One	日均模型部署200+
EvalOps	ACL 2021《Benchmarking Foundation Models》	-	可复现评估范式
GovOps	IEEE P7002数据治理标准	-	合规审计自动化
LearnOps	教育技术自适应学习理论+MLOps实时反馈	-	团队能力图谱演化

1.4 AISMM成熟度等级（L0-L5）

等级定义：L0–L5并非等距划分，而是依据127家金融机构AI系统运维审计数据识别出的6个关键拐点。

关键跃升阈值：

L2→L3（自动化编排）跃迁成功率不足19%
L4→L5（自主策略演化）跃迁成功率不足19%

各等级核心指标对比：

等级	MTTR分布	策略生成延迟	合规覆盖度
L2	12–47 min	N/A	≤63%
L4	8–22 s	3.2±0.7s	91–96%
L5	0.8–4.3 s	<1.1s（P95）	100%（动态映射）

1.5 AISMM三阶收敛机制

大模型研发中，需求发散、接口漂移、环境异构导致系统熵持续攀升。AISMM通过三阶收敛抑制熵增：

阶段	收敛目标	典型手段
一阶（语义）	接口意图一致性	OpenAPI v3 + 语义注解
二阶（状态）	跨环境执行确定性	容器镜像+权重快照绑定
三阶（演化）	长期维护可追溯性	模型血缘图+变更影响分析

1.6 AISMM真实落地效果

案例：某全球TOP3云厂商

采用AISMM v2.1后：
- LLM服务交付周期压缩 47%
- 模型上线前人工审核环节减少 62%
- 关键缺陷逃逸率下降至 0.03%
核心动作：依据AISMM四级"自主调优"要求，重定义了SRE与ML工程师的协同契约

1.7 SITS2026七层能力模型（AI原生研发国家标准级评估体系）

层级	名称	核心功能
第1层	语义感知层	多模态意图解析，BERT变体槽位填充
第2层	推理编排层	动态工作流调度，时限约束拓扑排序
第3层	自治执行层	闭环反馈控制，自动扩缩容
第4层	可信演化层	版本化策略引擎，跨域签名验证
第5层	跨域协同层	联邦状态同步，策略对齐
第6层	价值对齐层	意图偏差率（IDR）监控
第7层	生态演进层	协变韧性指数（CRI）追踪

二、李建忠：AI产业十二大趋势

2.1 计算范式趋势（趋势1-4）

趋势	核心内容	研发落地关联
趋势1	推理算力的池化、异构与弹性调度	影响AI推理基础设施架构设计
趋势2	云计算服务模式深度重构：从IaaS/PaaS/SaaS到Token Factory/MaaS/AaaS	开发模式从资源订阅转向能力订阅
趋势3	端云协同的AI计算架构走向成熟	影响模型部署策略与性能优化
趋势4	Token经济学从应用技巧升维为基础设施工学	成本控制与效率优化成为核心工程能力

2.2 开发范式趋势（趋势5-8）

趋势	核心内容	研发落地关联
趋势5	自主软件工程的边界持续拓展	Code Agent接管更多开发环节
趋势6	Harness的成熟进化：手工配置→AI辅助→自动优化	从提示工程→上下文工程→驾驭工程
趋势7	开发工具和基础设施从人类中心走向Agent原生	IDE、CI/CD、监控全面Agent化
趋势8	即时软件快速增长，柔性软件走向工程化成熟	软件形态从传统软件→柔性软件→即时软件

2.3 应用范式趋势（趋势9-12）

趋势	核心内容	研发落地关联
趋势9	Agent成为用户交互第一入口，传统软件下游化	软件从"为人类设计"转向"为Agent设计"
趋势10	生成式用户界面(GenUI)提供更个性化体验	UI开发范式根本性变革
趋势11	Agent将互联网从信息网络重构为行动网络	从信息检索到任务执行
趋势12	自然语言交互+Agent网络为多元设备提供人机界面	交互方式的范式转移

2.4 Agent对软件产业的双轮颠覆效应

李建忠指出，Agent正通过**“双轮颠覆效应”**重塑软件产业：

改变软件应用形态（Do What）：
- Agent成为用户第一交互界面
- 传统软件被进一步"下游化"，演变为可调用的工具
- 行业开始"为Agent去设计软件，而不是为人类设计软件"
颠覆软件开发方式（How Do）：
- CLI比GUI对Agent更友好
- 需要构建面向Agent的能力体系：可调用工具/API、Skills、运行云端环境（沙箱）

三、王伟：AI大模型开源影响力榜单

3.1 评测体系概述

发布者：奇点智能研究院开源技术委员会主任、华东师范大学数据科学与工程学院教授王伟

评测框架：突破单一性能维度局限，从数据、模型、测评与系统四个维度构建综合评价标准

评测规模：

53个核心指标
覆盖17个主流技术平台
采集13,541条有效链接
数据统计截止：2026年4月9日

开源地址：

GitHub: https://github.com/brucecui0120/OSIR-LMTS
GitCode: https://gitcode.com/brucec/OSIR-LMTS

3.2 四大维度评测详解

模型分榜：中国开源模型实力超越美国

模型类型	3月下载量占比	榜首模型
向量模型	38.4%	UKP Lab all-MiniLM-L6-v2（月下载2.02亿次）
语言模型	31.0%	阿里巴巴Qwen2.5-7B-Instruct（2338万次）
多模态模型	17.1%	OpenAI clip-vit-base-patch32（1914万次）

关键发现：

阿里巴巴以46个模型、覆盖5种模态的成绩占据绝对领先地位
中国在多模态模型领域的下载量已全面超越美国
得益于Qwen系列的持续迭代创新

数据分榜：中立机构领跑

机构	数据集数量	特色
北京智源人工智能研究院(BAAI)	518个	多模态数据集195个、具身数据集199个
上海人工智能实验室	-	排名第二
Google	-	排名第三

核心洞察：非营利、中立科研机构更愿意开放数据集，企业则更多将数据视为核心竞争力

系统分榜：工具链竞争成为关键战场

子指标	榜首机构	领先优势
算子库	北京智源人工智能研究院(BAAI)	500个高性能通用算子
通信库	智源研究院	FlagScale训练框架支撑
AI编译器	智源研究院	底层支撑优势显著
深度学习框架	华为、百度、阿里等	7家机构覆盖4项

评测分榜：标准化进程加速

上海AI实验室：开源评测数据集从19个增长至34个
智源研究院：实现13倍增速突破
头部机构纷纷开放自研评测工具，模型优化周期缩短60%以上

3.3 综合榜单结果

排名	机构	核心优势
🥇	阿里巴巴	全链条能力领先，Qwen系列持续迭代
🥈	北京智源人工智能研究院	数据集数量第一，系统工具链完善
🥉	上海人工智能实验室	开源评测数据集快速增长
4	Meta	Llama系列国际影响力
5	-	-

3.4 三大核心趋势

中国力量全面领跑：阿里巴巴、智源研究院、上海AI实验室 3家进入TOP5
全栈开源成为标配：单一模型开放已不够，数据、系统、评测协同开放才是生态核心
社区共建成为主流：评估方法开源、标准共建，全球AI正走向开放协同新阶段

四、「AI DSpace」AI开发者空间站

4.1 社区概述

定位：面向海内外技术专家的高密度AI开发者社区
发起方式：由多位技术专家以个人名义联合发起
核心目标：连接产业与学术、专家与初学者，推动更高密度的技术交流与实践协作

4.2 三大建设方向

方向一：社区驱动，开放参与

汇聚行业顶级技术专家
广泛吸纳在校生、初入职场者等新生力量
发挥连接器作用：搭建技术专家与入门从业者之间的沟通桥梁
采用"专家领衔、志愿者驱动"的参与机制
打造人人可贡献的开放生态

方向二：一站式内容与资源平台

硬核干货精选
线上线下立体化活动
本次大会发布的白皮书等独家资源
全方位支撑开发者学习与实践

方向三：全栈技术与产业版图覆盖

涵盖AI全链路多个领域：

领域	说明
AI全链路	基础设施→模型工程→核心应用场景→运维体系→行业洞察
基础设施	底层技术支撑
模型工程	模型训练、优化、部署
重点场景	行业应用场景解析
前沿应用	最新技术应用实践
运维落地	MLOps、AIOps实践
行业洞察	产业发展分析

五、AI工程落地：研发场景核心洞察

5.1 从AI-augmented到AI-native的范式跃迁

维度	AI-augmented	AI-native
控制流	静态分支	概率化路径选择
错误恢复	预设fallback	生成式自修复
状态管理	应用层显式维护	Agent内部持久化记忆（RAG+向量时序缓存）
任务调度	中心化工作流引擎	自主目标分解与工具反射循环
核心特征	人类工程师为决策中心	模型嵌入系统骨架，驱动设计/验证/迭代闭环

5.2 AI原生研发的核心工程实践

需求工程阶段

自然语言需求→结构化契约：多智能体协同引擎自动生成数据契约与SLA声明
意图图谱构建：IntentNode→RequirementNode→TestScenario的完整链路
验证规则自动生成：基于LLM的意图-约束映射器

构建与部署阶段

MCP编译器：模型权重与源码AST联合编译，输出统一IR包
零信任签名验证：模型哈希+编译器身份证书双因子签名
硬件TPM密钥背书：部署前CA链验证

运行时治理阶段

延迟感知在线策略决策：P99延迟预测+SLA余量动态加权
多目标优化：延迟、成本、SLA达标率综合权衡
实时反馈闭环：Prometheus指标+AI异常检测

5.3 六维成熟度评估框架（32项量化指标）

维度	指标数	核心指标示例
战略	6项	AI战略对齐度、技术路线图清晰度
组织	5项	AI团队规模、跨部门协同机制
流程	6项	变更审批自动化率、模型部署频率
技术	5项	跨云API一致性、LLM-Ops成熟度
数据	5项	元数据血缘覆盖率、数据新鲜度
安全	5项	对抗样本拒识率、合规覆盖度

5.4 AI驱动的测试工程

零样本测试生成

解析ONNX模型计算图，识别敏感张量节点
结合领域知识库生成语义等价对抗样本
输出Go语言测试桩，含覆盖率断言与可观测性埋点

TaaC（Test as a Code）效果对比

方法	漏洞检出率	误报率	平均响应延迟
传统规则匹配	41%	29%	120ms
TaaC语义模糊	78%	8%	310ms

5.5 驾驭工程（Harness Engineering）的演进

AI领域概念迭代极快，从提示工程(Prompt Engineering)到上下文工程(Context Engineering)，再到如今的驾驭工程(Harness Engineering)——即对AI智能体的协同与管理。

核心演进：

提示工程 → 上下文工程 → 驾驭工程
  (Prompt)    (Context)    (Harness)

驾驭工程的关键能力：

Agent能力编排与调度
多Agent协同治理
策略动态生成与执行
反馈闭环自动优化

六、大会嘉宾核心观点汇总

6.1 李建忠（奇点智能研究院院长）

核心观点：AI的Scaling Law正在经历持续进化——从Pre-training Scaling，到Post-training Scaling，再到Test-time Scaling，行业重心已明显转移。Agent Scaling的核心是在构建一个多步骤、自主运行的跨系统闭环，其最终衡量标准是任务完成度。

预测：传统软件乃至整个SaaS领域的市值确实都在下滑，这是软件行业的根本性变革。传统软件会被即时软件、个性化智能体等新型形态大量替代与蚕食。

6.2 黄非（荣耀终端AI首席科学家）

核心观点：单靠模型无法创造稳定的商业化闭环，真正的跨越在于从"模型决定一切"走向"模型与系统协同"，并最终迈向以人为中心的增强人类智能(AHI)。

代码是大模型最早也是最适合落地的应用场景：第一，代码运行具备低成本的模拟与验证环境；第二，GitHub等平台提供了大量高质量开源代码作为学习素材；第三，编译报错或运行结果反馈能提供丰富的信号用于模型优化。

6.3 周俊（蚂蚁集团副总裁）

核心观点：无论是国外顶尖大模型公司，还是国内厂商，在很多关键问题上并没有形成一致判断，大量"非共识"并存，这恰恰构成了AGI时代比较有趣的地方，把很多非共识慢慢做成了共识。

6.4 陈恺（上海人工智能实验室青年领军科学家）

核心观点：目前AI领域的核心发展方向已逐渐转向智能体和长程推理能力的提升。

6.5 王伟（华东师范大学教授）

核心观点：人们往往聚焦于模型本身的能力。然而，一个开源大模型的真正影响力，是由其背后的数据、模型、系统、评测四大方面共同决定的。这即是本次榜单评估的核心理念——将一个模型的技术体系作为整体进行评价。

七、大会分论坛主题一览

分论坛	核心议题
大语言模型技术演进	LLM最新技术进展、推理能力提升
多模态与世界模型	视觉-语言-音频多模态融合
AI计算平台与性能优化	GPU/NPU优化、推理加速
AI原生软件研发与氛围编程	AI辅助编码最佳实践
智能体系统与工程	Agent架构、编排、协作
AI原生应用创新与开发实践	落地案例分享
智能体使能的DevOps	AIOps、自动化运维
大模型系统架构	分布式训练、推理架构
AI Infra基础设施与运维	MLOps平台建设
具身智能与智能硬件	机器人、自动驾驶
开源模型与框架	开源生态建设
AI+行业落地实践	金融、医疗、制造应用

八、大会核心演讲嘉宾（部分）

嘉宾	机构	演讲主题
李建忠	奇点智能研究院/CSDN	Agent重塑软件与互联网产业新范式
黄非	荣耀终端	跨越周期：人工智能的演进和未来
周俊	蚂蚁集团	从语言到推理：百灵大模型的AGI探索
陈恺	上海人工智能实验室	万亿参数科学多模态大模型: Intern-S1-Pro技术解析
李永彬	阿里/通义灵码	从辅助编程到自主智能：Qoder在复杂软件工程中的Agentic演进与实践
张俊林	新浪微博	大模型在线策略蒸馏
王伟	华东师范大学/奇点研究院	AI大模型技术体系综合开源影响力榜单发布

九、关键结论与建议

9.1 对AI工程落地的关键启示

范式转变已发生：从"能不能做"的能力验证，走向"如何规模化落地"的系统工程
Agent成为新入口：从单点模型能力比拼，转向以Agent为核心的系统性重构
研发流程需重构：企业需重构研发流程以适应新的工作方式和提升组织效率
全栈能力成竞争核心：单一模型开放已不够，数据、系统、评测协同开放才是生态核心

9.2 对开发者的建议

拥抱AI原生思维：从"为人类设计软件"转向"为Agent设计软件"
掌握驾驭工程：从提示工程→上下文工程→驾驭工程的能力升级
关注即时软件：即时生成、即用即抛的低成本个性化软件是新方向
强化系统能力：更强调问题定义、系统理解以及与AI协同的能力

9.3 对企业的建议

引入AISMM评估框架：系统评估自身AI研发成熟度，制定跃迁路径
关注六大关键维度：战略、组织、流程、技术、数据、安全
重视数据飞轮：构建高质量数据管道，实现模型迭代闭环
拥抱社区共建：参与开源评测体系，借助行业共识推动标准发展

附录：相关资源链接

大会官网：https://ml-summit.org/
AISMM评测数据集GitHub：https://github.com/brucecui0120/OSIR-LMTS
AISMM评测数据集GitCode：https://gitcode.com/brucec/OSIR-LMTS
白皮书获取：关注CSDN公众号或官网获取完整白皮书

报告整理时间：2026年4月
信息来源：2026奇点智能技术大会官方发布及CSDN报道

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

谷歌屏幕共享功能别浪费：我把它改成了视频会议，结果人多就炸了

本文分享了将闲置的浏览器推流代码改造为视频会议功能的实践过程。作者最初采用WebRTC P2P Mesh架构，发现其在小规模会议（4人以内）具有零服务器成本、低延迟等优势，但随着人数增加会面临带宽和计算资源瓶颈（6人时上传带宽达10Mbps，10人时需解码10路视频）。通过对比Mesh与SFU架构的差异，作者最终保留Mesh模式但限制最大人数（6人），并为更大规模会议推荐SFU方案。文章揭示了技术

openEuler 社区

仿B站直播功能技术选型：为什么必须用SRS而不是WebRTC P2P？

本文分析了直播平台技术选型的关键问题，指出WebRTC P2P架构不适合大规模直播场景的原因。通过对比P2P和服务端转发两种架构的带宽消耗差异，说明P2P模式在观众数量增加时会导致主播端带宽不足。文章揭示了B站、抖音等平台采用RTMP推流+SRS服务器转发+FLV/HLS拉流的经典架构的原因，并指出WebRTC仅适用于连麦等特定场景。最后给出了务实的技术选型建议：RTMP推流+SRS转发+FLV拉

openEuler 社区

ouc操作系统期末速通知识点整理

openEuler 社区

所有评论(0)

查看更多评论

qqxhb

@qq_43792385

已为社区贡献1条内容

2026奇点智能技术大会深度解读报告

qqxhb

大会概览

一、《AI原生软件研发成熟度模型AISMM白皮书》

1.1 白皮书概述

1.2 AISMM vs CMMI 核心差异

1.3 AISMM五大核心域（Core Domains）

1.4 AISMM成熟度等级（L0-L5）

1.5 AISMM三阶收敛机制

1.6 AISMM真实落地效果

1.7 SITS2026七层能力模型（AI原生研发国家标准级评估体系）

二、李建忠：AI产业十二大趋势

2.1 计算范式趋势（趋势1-4）

2.2 开发范式趋势（趋势5-8）

2.3 应用范式趋势（趋势9-12）

2.4 Agent对软件产业的双轮颠覆效应

三、王伟：AI大模型开源影响力榜单

3.1 评测体系概述

3.2 四大维度评测详解

模型分榜：中国开源模型实力超越美国

数据分榜：中立机构领跑

系统分榜：工具链竞争成为关键战场

评测分榜：标准化进程加速

3.3 综合榜单结果

3.4 三大核心趋势

四、「AI DSpace」AI开发者空间站

4.1 社区概述

4.2 三大建设方向

方向一：社区驱动，开放参与

方向二：一站式内容与资源平台

方向三：全栈技术与产业版图覆盖

五、AI工程落地：研发场景核心洞察

5.1 从AI-augmented到AI-native的范式跃迁

5.2 AI原生研发的核心工程实践

需求工程阶段

构建与部署阶段

运行时治理阶段

5.3 六维成熟度评估框架（32项量化指标）

5.4 AI驱动的测试工程

零样本测试生成

TaaC（Test as a Code）效果对比

5.5 驾驭工程（Harness Engineering）的演进

六、大会嘉宾核心观点汇总

6.1 李建忠（奇点智能研究院院长）

6.2 黄非（荣耀终端AI首席科学家）

6.3 周俊（蚂蚁集团副总裁）

6.4 陈恺（上海人工智能实验室青年领军科学家）

6.5 王伟（华东师范大学教授）

七、大会分论坛主题一览

八、大会核心演讲嘉宾（部分）

九、关键结论与建议

9.1 对AI工程落地的关键启示

9.2 对开发者的建议

9.3 对企业的建议

附录：相关资源链接

所有评论(0)

温馨提示：您尚未绑定手机号

qqxhb