从模型到智能体:下一代AI应用的开发范式
本文探讨了AI应用从单一模型向智能体(Agent)系统的演进趋势。作者展菲指出,当前AI行业正经历从"模型应用"到"智能体应用"的深刻转变。传统ChatBot基于"输入-输出"模式,而Agent系统具备感知、决策、执行、观察的完整闭环能力,能处理状态、任务、工具、权限等复杂要素。文章分析了Agent系统的核心特征:具备运行时环境、状态管理、工具调用、记忆系统等组件,使其更像小型操作系统。作者强调,

大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。
图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:华为HDE/HDG
我的博客内容涵盖广泛,主要分享技术教程、Bug解决方案、开发工具使用、前沿科技资讯、产品评测与使用体验。我特别关注云服务产品评测、AI 产品对比、开发板性能测试以及技术报告,同时也会提供产品优缺点分析、横向对比,并分享技术沙龙与行业大会的参会体验。我的目标是为读者提供有深度、有实用价值的技术洞察与分析。
展菲:您的前沿技术领航员
👋 大家好,我是展菲!
📱 全网搜索“展菲”,即可纵览我在各大平台的知识足迹。
每周定时推送干货满满的技术长文,从新兴框架的剖析到运维实战的复盘,助您技术进阶之路畅通无阻。
文章目录
-
- 引言
- 一、模型,不等于 AI 应用
- 二、ChatBot 和 Agent 的根本区别
- 三、下一代 AI 应用,开始像“运行时系统”
- 四、Prompt 不再是核心壁垒
- 五、为什么 Memory 开始变重要
- 六、Tool Use 正在改变 AI
- 七、Agent 最大的问题其实不是“智能”
- 八、AI 应用开始进入“状态时代”
- 九、多 Agent 正在成为下一阶段
- 十、AI 应用正在从“页面驱动”
- 十一、下一代 AI 应用会越来越“异步”
- 十二、为什么 Runtime 会成为核心竞争力
- 十三、AI 开发范式正在变化
- 十四、未来的 AI App 会越来越像“数字员工”
- 十五、从模型到智能体,本质是一次系统升级
- 总结
引言
过去几年,AI 行业有一个非常明显的变化,最早大家讨论的是:
模型够不够大
参数够不够多
benchmark 排名高不高
后来开始变成:
推理够不够快
上下文够不够长
成本能不能压下来
而现在,一个新的问题开始越来越重要:
AI 到底怎么真正“干活”?
因为大家慢慢发现:
一个会聊天的模型
≠ 一个真正可工作的 AI 系统
真正进入业务以后,企业需要的不是:
- “能回答问题”;
- “能续写内容”;
- “能写几段代码”。
而是:
- 能调用系统;
- 能执行任务;
- 能理解状态;
- 能长期运行;
- 能协作;
- 能恢复失败;
- 能操作工具;
- 能管理流程;
- 能和真实世界交互。
于是 AI 应用开始发生一次很深的变化:从“模型应用”,进入“智能体应用”。
这不是 UI 的变化,也不是 prompt 的变化。而是:
下一代 AI 软件,正在从“函数调用”进化成“运行时系统”。
这篇文章,我们就来聊聊:
- 为什么“模型”已经不够了;
- 为什么 AI 应用正在走向 Agent;
- Agent 和传统 ChatBot 的根本区别是什么;
- 下一代 AI 应用为什么越来越像“操作系统”;
- 为什么未来 AI 开发重点会从 prompt 转向 runtime、memory、state 和 orchestration。
一、模型,不等于 AI 应用
很多人第一次接触大模型时,会有一种天然理解:
用户输入
↓
模型生成
↓
结果输出
于是很多 AI 产品最早都长这样:
聊天框 + 大模型
但问题很快出现了。
因为真实业务里的任务,并不是“一次输入,一次输出”。
比如:
- 自动处理工单;
- 自动审批;
- AI 销售;
- AI 客服;
- AI 编程;
- AI 数据分析;
- AI 运营;
- AI 自动化流程。
这些任务都有一个共同点:它们不是“回答问题”,而是:“持续执行”。
这意味着 AI 必须开始处理:
- 状态;
- 任务;
- 工具;
- 权限;
- 工作流;
- memory;
- retry;
- context;
- checkpoint;
- side effect。
于是:
模型
开始只是 AI 系统中的一个组件。
二、ChatBot 和 Agent 的根本区别
传统 ChatBot 更像:
输入
→ 输出
而 Agent 更像:
感知
→ 决策
→ 执行
→ 观察
→ 再决策
这两者最大的区别是:Agent 会“行动”。
比如一个 AI Coding Agent:它不是只生成代码。
它会:
读项目
↓
理解结构
↓
查找文件
↓
修改代码
↓
运行测试
↓
分析报错
↓
继续修复
↓
生成 PR
这里真正重要的已经不是:
token generation
而是:
task orchestration
模型只负责其中一部分,真正复杂的是:
- runtime;
- state;
- tool;
- memory;
- workflow;
- execution;
- recovery。
三、下一代 AI 应用,开始像“运行时系统”
这是现在 AI 行业一个非常深的变化,过去:
App = 页面 + 接口 + 数据库
现在:
AI App = Runtime + Agent + Memory + Tooling
越来越多 AI 系统开始出现:
- agent runtime;
- task scheduler;
- tool router;
- memory layer;
- execution graph;
- state machine;
- trace system;
- eval system;
- fallback system。
因为:
Agent 不是一次调用,而是一个长期运行过程。
于是 AI 应用开始越来越像:
一个小型操作系统
它需要:
- 调度;
- 状态管理;
- 资源管理;
- memory;
- recovery;
- execution;
- logging;
- trace;
- interrupt;
- rollback。
这和传统 Web App 已经完全不同。
四、Prompt 不再是核心壁垒
过去两年,很多人把 AI 开发理解成:
Prompt Engineering
但现在越来越明显:
Prompt 很重要,但 Prompt 不再是最核心的部分。
因为:Prompt 只能解决“单次生成”,而真实 Agent 系统面对的是:
- 多轮状态;
- 长期记忆;
- 工具协作;
- 多 Agent;
- 外部系统;
- 异步任务;
- 长时间运行;
- 用户中断;
- 错误恢复。
这些问题,本质都不是 prompt 能解决的。于是 AI 开发重点开始转移:
从 Prompt
转向 Runtime
五、为什么 Memory 开始变重要
传统 ChatBot 最大的问题之一就是:
它没有真正的“持续状态”
上下文窗口一断:
AI 就“失忆”了
但 Agent 不行,因为真实任务往往跨越:
- 多轮;
- 多天;
- 多系统;
- 多用户;
- 多任务。
于是:Memory 开始成为 Agent 核心。
包括:
- short-term memory;
- long-term memory;
- vector memory;
- procedural memory;
- episodic memory;
- semantic memory。
很多未来 AI 系统,本质上都会变成:
LLM + Memory + Runtime
而不是:
LLM only
六、Tool Use 正在改变 AI
这是 Agent 和传统模型最大的分水岭之一,以前:
模型只能“生成”
现在:
模型开始“调用”
比如:
- 调数据库;
- 发邮件;
- 查日历;
- 调 CRM;
- 操作浏览器;
- 调 GitHub;
- 调支付系统;
- 调内部 API;
- 调 MCP Tool;
- 调 RAG 系统。
于是:
LLM
开始像 CPU
而:
Tool
开始像外设。
真正的 Agent 系统越来越像:
LLM = 推理核心
Tool = 执行能力
Runtime = 操作系统
七、Agent 最大的问题其实不是“智能”
很多人以为:
Agent 最大问题
= 模型不够聪明
实际上很多时候并不是,真正困难的问题是:
- 状态错乱;
- tool 调错;
- context 污染;
- retry 风暴;
- memory 漂移;
- hallucination action;
- 无限循环;
- 权限失控;
- side effect;
- 异步失败;
- checkpoint 丢失。
也就是说:Agent 最大的问题,其实是工程稳定性。
因为:
一旦 AI 开始执行动作,
风险就从“回答错误”
升级成“系统错误”。
八、AI 应用开始进入“状态时代”
传统 Web App:
用户状态
通常比较简单
但 Agent 系统状态会急剧复杂。比如一个 AI task 可能经历:
pending
→ planning
→ running
→ waiting_tool
→ retrying
→ paused
→ human_review
→ resumed
→ completed
→ failed
→ canceled
于是:AI 应用越来越像状态机系统。很多团队后来都会发现,真正难写的不是 prompt。
而是:
- state transition;
- event handling;
- retry policy;
- timeout;
- compensation;
- rollback;
- concurrency;
- observability。
九、多 Agent 正在成为下一阶段
一个 Agent 已经很复杂,多个 Agent 会更复杂。
因为:
多个 AI
开始协作
比如:
Planner Agent
↓
Research Agent
↓
Coding Agent
↓
Review Agent
↓
Deploy Agent
问题是:
多 Agent 系统会天然出现分布式系统问题。
包括:
- task dependency;
- deadlock;
- race condition;
- duplicated execution;
- shared memory;
- state synchronization;
- cascading failure。
于是未来 Agent Infra 会越来越像:
分布式系统 + 工作流引擎
而不是:
聊天机器人。
十、AI 应用正在从“页面驱动”
进入“意图驱动”
过去软件是:
用户点击页面
→ 调接口
→ 返回结果
未来会越来越变成:
用户表达目标
→ Agent 自主拆解
→ 系统执行任务
→ 返回最终结果
也就是说:UI 不再是核心入口,真正的入口开始变成:
Intent(意图)
这也是为什么越来越多人开始说:
未来的软件
可能都会 Agent 化。
十一、下一代 AI 应用会越来越“异步”
传统 ChatBot:
几秒内返回
但真实 Agent 任务可能需要:
- 10 分钟;
- 1 小时;
- 甚至更久。
比如:
- 大规模代码修改;
- 数据分析;
- 视频生成;
- 自动运营;
- 长链路审批;
- 多系统同步。
于是:
AI 应用开始进入异步时代。
它需要:
- task queue;
- event bus;
- checkpoint;
- resume;
- notification;
- retry;
- distributed execution。
这时候:
AI App
越来越像后端系统。
十二、为什么 Runtime 会成为核心竞争力
过去:
模型能力
决定 AI 上限
未来:
Runtime 能力
决定 AI 产品体验
因为:
- 谁更会调度;
- 谁更会管理 memory;
- 谁更会控制 context;
- 谁更会做 tool orchestration;
- 谁更会做 fallback;
- 谁更会做 recovery;
- 谁更会做 tracing;
- 谁更会做 eval;
都会直接决定:
Agent 是否稳定。
未来真正强的 AI 公司,很可能不是:
“谁模型最大”
而是:
“谁 runtime 最成熟”。
十三、AI 开发范式正在变化
传统开发:
写业务逻辑
AI 开发:
设计运行系统
过去工程师主要关心:
- API;
- 数据库;
- 页面;
- 缓存;
- 权限。
未来 AI 工程师会越来越关注:
- prompt;
- memory;
- context;
- state;
- tool;
- eval;
- trace;
- orchestration;
- runtime;
- agent lifecycle。
所以: AI 工程正在从“接口工程”,进入“运行时工程”。
十四、未来的 AI App 会越来越像“数字员工”
这一点其实已经越来越明显,未来很多 AI 应用,不再像:
工具软件
而更像:
数字员工
它会:
- 接任务;
- 做计划;
- 调工具;
- 写结果;
- 处理异常;
- 请求人工确认;
- 长期记忆;
- 自主协作。
于是:
AI 系统
开始从“软件”
变成“组织能力”。
十五、从模型到智能体,本质是一次系统升级
很多人把 Agent 理解成:
大模型 + tools
但真正的 Agent 远不止如此。它本质上是:AI 系统的一次架构升级。
从:
单次生成
进入:
长期运行
从:
模型推理
进入:
系统执行
从:
Prompt
进入:
Runtime
从:
聊天
进入:
工作
总结
AI 应用正在发生一次非常深的范式变化,过去:
模型 = AI 应用
未来:
模型
只是 AI Runtime 中的一个组件。
真正的下一代 AI 系统,会越来越强调:
- memory;
- runtime;
- orchestration;
- tool use;
- state machine;
- execution;
- observability;
- recovery;
- multi-agent;
- asynchronous workflow。
所以从模型到智能体,本质上不是一次产品升级。
而是:
AI 从“生成工具”进入“执行系统”的开始。
openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构
更多推荐

所有评论(0)