从模型到智能体：下一代AI应用的开发范式

本文探讨了AI应用从单一模型向智能体(Agent)系统的演进趋势。作者展菲指出，当前AI行业正经历从"模型应用"到"智能体应用"的深刻转变。传统ChatBot基于"输入-输出"模式，而Agent系统具备感知、决策、执行、观察的完整闭环能力，能处理状态、任务、工具、权限等复杂要素。文章分析了Agent系统的核心特征：具备运行时环境、状态管理、工具调用、记忆系统等组件，使其更像小型操作系统。作者强调，

Swift社区

662人浏览 · 2026-05-20 13:45:36

Swift社区 · 2026-05-20 13:45:36 发布

在这里插入图片描述

网罗开发 （小红书、快手、视频号同名）

大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。

图书作者：《ESP32-C3 物联网工程开发实战》
图书作者：《SwiftUI 入门，进阶与实战》
超级个体：COC上海社区主理人
特约讲师：大学讲师，谷歌亚马逊分享嘉宾
科技博主：华为HDE/HDG

我的博客内容涵盖广泛，主要分享技术教程、Bug解决方案、开发工具使用、前沿科技资讯、产品评测与使用体验。我特别关注云服务产品评测、AI 产品对比、开发板性能测试以及技术报告，同时也会提供产品优缺点分析、横向对比，并分享技术沙龙与行业大会的参会体验。我的目标是为读者提供有深度、有实用价值的技术洞察与分析。

展菲：您的前沿技术领航员
👋 大家好，我是展菲！
📱 全网搜索“展菲”，即可纵览我在各大平台的知识足迹。
每周定时推送干货满满的技术长文，从新兴框架的剖析到运维实战的复盘，助您技术进阶之路畅通无阻。

文章目录

引言

过去几年，AI 行业有一个非常明显的变化，最早大家讨论的是：

模型够不够大
参数够不够多
benchmark 排名高不高

后来开始变成：

推理够不够快
上下文够不够长
成本能不能压下来

而现在，一个新的问题开始越来越重要：

AI 到底怎么真正“干活”？

因为大家慢慢发现：

一个会聊天的模型
≠ 一个真正可工作的 AI 系统

真正进入业务以后，企业需要的不是：

“能回答问题”；
“能续写内容”；
“能写几段代码”。

而是：

能调用系统；
能执行任务；
能理解状态；
能长期运行；
能协作；
能恢复失败；
能操作工具；
能管理流程；
能和真实世界交互。

于是 AI 应用开始发生一次很深的变化：从“模型应用”，进入“智能体应用”。

这不是 UI 的变化，也不是 prompt 的变化。而是：

下一代 AI 软件，正在从“函数调用”进化成“运行时系统”。

这篇文章，我们就来聊聊：

为什么“模型”已经不够了；
为什么 AI 应用正在走向 Agent；
Agent 和传统 ChatBot 的根本区别是什么；
下一代 AI 应用为什么越来越像“操作系统”；
为什么未来 AI 开发重点会从 prompt 转向 runtime、memory、state 和 orchestration。

一、模型，不等于 AI 应用

很多人第一次接触大模型时，会有一种天然理解：

用户输入
    ↓
模型生成
    ↓
结果输出

于是很多 AI 产品最早都长这样：

聊天框 + 大模型

但问题很快出现了。

因为真实业务里的任务，并不是“一次输入，一次输出”。

比如：

自动处理工单；
自动审批；
AI 销售；
AI 客服；
AI 编程；
AI 数据分析；
AI 运营；
AI 自动化流程。

这些任务都有一个共同点：它们不是“回答问题”，而是：“持续执行”。

这意味着 AI 必须开始处理：

状态；
任务；
工具；
权限；
工作流；
memory；
retry；
context；
checkpoint；
side effect。

于是：

模型
开始只是 AI 系统中的一个组件。

二、ChatBot 和 Agent 的根本区别

传统 ChatBot 更像：

输入
→ 输出

而 Agent 更像：

感知
→ 决策
→ 执行
→ 观察
→ 再决策

这两者最大的区别是：Agent 会“行动”。

比如一个 AI Coding Agent：它不是只生成代码。

它会：

读项目
  ↓
理解结构
  ↓
查找文件
  ↓
修改代码
  ↓
运行测试
  ↓
分析报错
  ↓
继续修复
  ↓
生成 PR

这里真正重要的已经不是：

token generation

而是：

task orchestration

模型只负责其中一部分，真正复杂的是：

runtime；
state；
tool；
memory；
workflow；
execution；
recovery。

三、下一代 AI 应用，开始像“运行时系统”

这是现在 AI 行业一个非常深的变化，过去：

App = 页面 + 接口 + 数据库

现在：

AI App = Runtime + Agent + Memory + Tooling

越来越多 AI 系统开始出现：

agent runtime；
task scheduler；
tool router；
memory layer；
execution graph；
state machine；
trace system；
eval system；
fallback system。

因为：

Agent 不是一次调用，而是一个长期运行过程。

于是 AI 应用开始越来越像：

一个小型操作系统

它需要：

调度；
状态管理；
资源管理；
memory；
recovery；
execution；
logging；
trace；
interrupt；
rollback。

这和传统 Web App 已经完全不同。

四、Prompt 不再是核心壁垒

过去两年，很多人把 AI 开发理解成：

Prompt Engineering

但现在越来越明显：

Prompt 很重要，但 Prompt 不再是最核心的部分。

因为：Prompt 只能解决“单次生成”，而真实 Agent 系统面对的是：

多轮状态；
长期记忆；
工具协作；
多 Agent；
外部系统；
异步任务；
长时间运行；
用户中断；
错误恢复。

这些问题，本质都不是 prompt 能解决的。于是 AI 开发重点开始转移：

从 Prompt
转向 Runtime

五、为什么 Memory 开始变重要

传统 ChatBot 最大的问题之一就是：

它没有真正的“持续状态”

上下文窗口一断：

AI 就“失忆”了

但 Agent 不行，因为真实任务往往跨越：

多轮；
多天；
多系统；
多用户；
多任务。

于是：Memory 开始成为 Agent 核心。

包括：

short-term memory；
long-term memory；
vector memory；
procedural memory；
episodic memory；
semantic memory。

很多未来 AI 系统，本质上都会变成：

LLM + Memory + Runtime

而不是：

LLM only

六、Tool Use 正在改变 AI

这是 Agent 和传统模型最大的分水岭之一，以前：

模型只能“生成”

现在：

模型开始“调用”

比如：

调数据库；
发邮件；
查日历；
调 CRM；
操作浏览器；
调 GitHub；
调支付系统；
调内部 API；
调 MCP Tool；
调 RAG 系统。

于是：

LLM
开始像 CPU

而：

Tool
开始像外设。

真正的 Agent 系统越来越像：

LLM = 推理核心
Tool = 执行能力
Runtime = 操作系统

七、Agent 最大的问题其实不是“智能”

很多人以为：

Agent 最大问题
= 模型不够聪明

实际上很多时候并不是，真正困难的问题是：

状态错乱；
tool 调错；
context 污染；
retry 风暴；
memory 漂移；
hallucination action；
无限循环；
权限失控；
side effect；
异步失败；
checkpoint 丢失。

也就是说：Agent 最大的问题，其实是工程稳定性。

因为：

一旦 AI 开始执行动作，
风险就从“回答错误”
升级成“系统错误”。

八、AI 应用开始进入“状态时代”

传统 Web App：

用户状态
通常比较简单

但 Agent 系统状态会急剧复杂。比如一个 AI task 可能经历：

pending
→ planning
→ running
→ waiting_tool
→ retrying
→ paused
→ human_review
→ resumed
→ completed
→ failed
→ canceled

于是：AI 应用越来越像状态机系统。很多团队后来都会发现，真正难写的不是 prompt。

而是：

state transition；
event handling；
retry policy；
timeout；
compensation；
rollback；
concurrency；
observability。

九、多 Agent 正在成为下一阶段

一个 Agent 已经很复杂，多个 Agent 会更复杂。

因为：

多个 AI
开始协作

比如：

Planner Agent
    ↓
Research Agent
    ↓
Coding Agent
    ↓
Review Agent
    ↓
Deploy Agent

问题是：

多 Agent 系统会天然出现分布式系统问题。

包括：

task dependency；
deadlock；
race condition；
duplicated execution；
shared memory；
state synchronization；
cascading failure。

于是未来 Agent Infra 会越来越像：

分布式系统 + 工作流引擎

而不是：

聊天机器人。

十、AI 应用正在从“页面驱动”

进入“意图驱动”

过去软件是：

用户点击页面
→ 调接口
→ 返回结果

未来会越来越变成：

用户表达目标
→ Agent 自主拆解
→ 系统执行任务
→ 返回最终结果

也就是说：UI 不再是核心入口，真正的入口开始变成：

Intent（意图）

这也是为什么越来越多人开始说：

未来的软件
可能都会 Agent 化。

十一、下一代 AI 应用会越来越“异步”

传统 ChatBot：

几秒内返回

但真实 Agent 任务可能需要：

10 分钟；
1 小时；
甚至更久。

比如：

大规模代码修改；
数据分析；
视频生成；
自动运营；
长链路审批；
多系统同步。

于是：

AI 应用开始进入异步时代。

它需要：

task queue；
event bus；
checkpoint；
resume；
notification；
retry；
distributed execution。

这时候：

AI App
越来越像后端系统。

十二、为什么 Runtime 会成为核心竞争力

过去：

模型能力
决定 AI 上限

未来：

Runtime 能力
决定 AI 产品体验

因为：

谁更会调度；
谁更会管理 memory；
谁更会控制 context；
谁更会做 tool orchestration；
谁更会做 fallback；
谁更会做 recovery；
谁更会做 tracing；
谁更会做 eval；

都会直接决定：

Agent 是否稳定。

未来真正强的 AI 公司，很可能不是：

“谁模型最大”

而是：

“谁 runtime 最成熟”。

十三、AI 开发范式正在变化

传统开发：

写业务逻辑

AI 开发：

设计运行系统

过去工程师主要关心：

API；
数据库；
页面；
缓存；
权限。

未来 AI 工程师会越来越关注：

prompt；
memory；
context；
state；
tool；
eval；
trace；
orchestration；
runtime；
agent lifecycle。

所以： AI 工程正在从“接口工程”，进入“运行时工程”。

十四、未来的 AI App 会越来越像“数字员工”

这一点其实已经越来越明显，未来很多 AI 应用，不再像：

工具软件

而更像：

数字员工

它会：

接任务；
做计划；
调工具；
写结果；
处理异常；
请求人工确认；
长期记忆；
自主协作。

于是：

AI 系统
开始从“软件”
变成“组织能力”。

十五、从模型到智能体，本质是一次系统升级

很多人把 Agent 理解成：

大模型 + tools

但真正的 Agent 远不止如此。它本质上是：AI 系统的一次架构升级。

从：

单次生成

进入：

长期运行

从：

模型推理

进入：

系统执行

从：

Prompt

进入：

Runtime

从：

聊天

进入：

工作

总结

AI 应用正在发生一次非常深的范式变化，过去：

模型 = AI 应用

未来：

模型
只是 AI Runtime 中的一个组件。

真正的下一代 AI 系统，会越来越强调：

memory；
runtime；
orchestration；
tool use；
state machine；
execution；
observability；
recovery；
multi-agent；
asynchronous workflow。

所以从模型到智能体，本质上不是一次产品升级。

而是：

AI 从“生成工具”进入“执行系统”的开始。

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

WebRTC只管流不管控——自研信令服务器的状态机设计

WebRTC 搞定了音视频流的传输。谁有权建房谁有权加入谁有权踢人旁观和发言有什么区别断线了怎么处理这些是信令服务器的活。这套自研协议只有 10 条左右信令，覆盖了远程帮办的全部业务场景。所有状态变更必须经过服务器——不是性能最优的方案，但状态一致性最高。政务场景不需要百万人并发，但绝对不能在通话中丢了状态。信令层的代码不复杂。复杂的是想清楚"每个状态下谁可以做什么"。这个想清楚了，代码是自然推导

openEuler 社区

认知架构（如SOAR、ACT-R）与AI Agent

在深入探讨具体的认知架构之前，让我们先明确一些核心概念。认知架构（Cognitive Architecture）可以被定义为：一种关于人类认知结构的计算理论，它规定了认知系统的基本组成部分、这些部分之间的交互方式，以及它们如何共同产生智能行为。换句话说，认知架构就像是智能系统的“操作系统”，它提供了一套基础设施和机制，使得各种认知功能（如感知、记忆、推理、决策）能够协同工作。记忆系统：包括感觉记忆