在这里插入图片描述

网罗开发 (小红书、快手、视频号同名)

  大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。

图书作者:《ESP32-C3 物联网工程开发实战》
图书作者:《SwiftUI 入门,进阶与实战》
超级个体:COC上海社区主理人
特约讲师:大学讲师,谷歌亚马逊分享嘉宾
科技博主:华为HDE/HDG

我的博客内容涵盖广泛,主要分享技术教程、Bug解决方案、开发工具使用、前沿科技资讯、产品评测与使用体验。我特别关注云服务产品评测、AI 产品对比、开发板性能测试以及技术报告,同时也会提供产品优缺点分析、横向对比,并分享技术沙龙与行业大会的参会体验。我的目标是为读者提供有深度、有实用价值的技术洞察与分析。

展菲:您的前沿技术领航员
👋 大家好,我是展菲!
📱 全网搜索“展菲”,即可纵览我在各大平台的知识足迹。
每周定时推送干货满满的技术长文,从新兴框架的剖析到运维实战的复盘,助您技术进阶之路畅通无阻。


引言

过去几年,AI 行业有一个非常明显的变化,最早大家讨论的是:

模型够不够大
参数够不够多
benchmark 排名高不高

后来开始变成:

推理够不够快
上下文够不够长
成本能不能压下来

而现在,一个新的问题开始越来越重要:

AI 到底怎么真正“干活”?

因为大家慢慢发现:

一个会聊天的模型
≠ 一个真正可工作的 AI 系统

真正进入业务以后,企业需要的不是:

  • “能回答问题”;
  • “能续写内容”;
  • “能写几段代码”。

而是:

  • 能调用系统;
  • 能执行任务;
  • 能理解状态;
  • 能长期运行;
  • 能协作;
  • 能恢复失败;
  • 能操作工具;
  • 能管理流程;
  • 能和真实世界交互。

于是 AI 应用开始发生一次很深的变化:从“模型应用”,进入“智能体应用”。

这不是 UI 的变化,也不是 prompt 的变化。而是:

下一代 AI 软件,正在从“函数调用”进化成“运行时系统”。

这篇文章,我们就来聊聊:

  • 为什么“模型”已经不够了;
  • 为什么 AI 应用正在走向 Agent;
  • Agent 和传统 ChatBot 的根本区别是什么;
  • 下一代 AI 应用为什么越来越像“操作系统”;
  • 为什么未来 AI 开发重点会从 prompt 转向 runtime、memory、state 和 orchestration。

一、模型,不等于 AI 应用

很多人第一次接触大模型时,会有一种天然理解:

用户输入
    ↓
模型生成
    ↓
结果输出

于是很多 AI 产品最早都长这样:

聊天框 + 大模型

但问题很快出现了。

因为真实业务里的任务,并不是“一次输入,一次输出”。

比如:

  • 自动处理工单;
  • 自动审批;
  • AI 销售;
  • AI 客服;
  • AI 编程;
  • AI 数据分析;
  • AI 运营;
  • AI 自动化流程。

这些任务都有一个共同点:它们不是“回答问题”,而是:“持续执行”。

这意味着 AI 必须开始处理:

  • 状态;
  • 任务;
  • 工具;
  • 权限;
  • 工作流;
  • memory;
  • retry;
  • context;
  • checkpoint;
  • side effect。

于是:

模型
开始只是 AI 系统中的一个组件。

二、ChatBot 和 Agent 的根本区别

传统 ChatBot 更像:

输入
→ 输出

而 Agent 更像:

感知
→ 决策
→ 执行
→ 观察
→ 再决策

这两者最大的区别是:Agent 会“行动”。

比如一个 AI Coding Agent:它不是只生成代码。

它会:

读项目
  ↓
理解结构
  ↓
查找文件
  ↓
修改代码
  ↓
运行测试
  ↓
分析报错
  ↓
继续修复
  ↓
生成 PR

这里真正重要的已经不是:

token generation

而是:

task orchestration

模型只负责其中一部分,真正复杂的是:

  • runtime;
  • state;
  • tool;
  • memory;
  • workflow;
  • execution;
  • recovery。

三、下一代 AI 应用,开始像“运行时系统”

这是现在 AI 行业一个非常深的变化,过去:

App = 页面 + 接口 + 数据库

现在:

AI App = Runtime + Agent + Memory + Tooling

越来越多 AI 系统开始出现:

  • agent runtime;
  • task scheduler;
  • tool router;
  • memory layer;
  • execution graph;
  • state machine;
  • trace system;
  • eval system;
  • fallback system。

因为:

Agent 不是一次调用,而是一个长期运行过程。

于是 AI 应用开始越来越像:

一个小型操作系统

它需要:

  • 调度;
  • 状态管理;
  • 资源管理;
  • memory;
  • recovery;
  • execution;
  • logging;
  • trace;
  • interrupt;
  • rollback。

这和传统 Web App 已经完全不同。

四、Prompt 不再是核心壁垒

过去两年,很多人把 AI 开发理解成:

Prompt Engineering

但现在越来越明显:

Prompt 很重要,但 Prompt 不再是最核心的部分。

因为:Prompt 只能解决“单次生成”,而真实 Agent 系统面对的是:

  • 多轮状态;
  • 长期记忆;
  • 工具协作;
  • 多 Agent;
  • 外部系统;
  • 异步任务;
  • 长时间运行;
  • 用户中断;
  • 错误恢复。

这些问题,本质都不是 prompt 能解决的。于是 AI 开发重点开始转移:

从 Prompt
转向 Runtime

五、为什么 Memory 开始变重要

传统 ChatBot 最大的问题之一就是:

它没有真正的“持续状态”

上下文窗口一断:

AI 就“失忆”了

但 Agent 不行,因为真实任务往往跨越:

  • 多轮;
  • 多天;
  • 多系统;
  • 多用户;
  • 多任务。

于是:Memory 开始成为 Agent 核心。

包括:

  • short-term memory;
  • long-term memory;
  • vector memory;
  • procedural memory;
  • episodic memory;
  • semantic memory。

很多未来 AI 系统,本质上都会变成:

LLM + Memory + Runtime

而不是:

LLM only

六、Tool Use 正在改变 AI

这是 Agent 和传统模型最大的分水岭之一,以前:

模型只能“生成”

现在:

模型开始“调用”

比如:

  • 调数据库;
  • 发邮件;
  • 查日历;
  • 调 CRM;
  • 操作浏览器;
  • 调 GitHub;
  • 调支付系统;
  • 调内部 API;
  • 调 MCP Tool;
  • 调 RAG 系统。

于是:

LLM
开始像 CPU

而:

Tool
开始像外设。

真正的 Agent 系统越来越像:

LLM = 推理核心
Tool = 执行能力
Runtime = 操作系统

七、Agent 最大的问题其实不是“智能”

很多人以为:

Agent 最大问题
= 模型不够聪明

实际上很多时候并不是,真正困难的问题是:

  • 状态错乱;
  • tool 调错;
  • context 污染;
  • retry 风暴;
  • memory 漂移;
  • hallucination action;
  • 无限循环;
  • 权限失控;
  • side effect;
  • 异步失败;
  • checkpoint 丢失。

也就是说:Agent 最大的问题,其实是工程稳定性。

因为:

一旦 AI 开始执行动作,
风险就从“回答错误”
升级成“系统错误”。

八、AI 应用开始进入“状态时代”

传统 Web App:

用户状态
通常比较简单

但 Agent 系统状态会急剧复杂。比如一个 AI task 可能经历:

pending
→ planning
→ running
→ waiting_tool
→ retrying
→ paused
→ human_review
→ resumed
→ completed
→ failed
→ canceled

于是:AI 应用越来越像状态机系统。很多团队后来都会发现,真正难写的不是 prompt。

而是:

  • state transition;
  • event handling;
  • retry policy;
  • timeout;
  • compensation;
  • rollback;
  • concurrency;
  • observability。

九、多 Agent 正在成为下一阶段

一个 Agent 已经很复杂,多个 Agent 会更复杂。

因为:

多个 AI
开始协作

比如:

Planner Agent
    ↓
Research Agent
    ↓
Coding Agent
    ↓
Review Agent
    ↓
Deploy Agent

问题是:

多 Agent 系统会天然出现分布式系统问题。

包括:

  • task dependency;
  • deadlock;
  • race condition;
  • duplicated execution;
  • shared memory;
  • state synchronization;
  • cascading failure。

于是未来 Agent Infra 会越来越像:

分布式系统 + 工作流引擎

而不是:

聊天机器人。

十、AI 应用正在从“页面驱动”

进入“意图驱动”

过去软件是:

用户点击页面
→ 调接口
→ 返回结果

未来会越来越变成:

用户表达目标
→ Agent 自主拆解
→ 系统执行任务
→ 返回最终结果

也就是说:UI 不再是核心入口,真正的入口开始变成:

Intent(意图)

这也是为什么越来越多人开始说:

未来的软件
可能都会 Agent 化。

十一、下一代 AI 应用会越来越“异步”

传统 ChatBot:

几秒内返回

但真实 Agent 任务可能需要:

  • 10 分钟;
  • 1 小时;
  • 甚至更久。

比如:

  • 大规模代码修改;
  • 数据分析;
  • 视频生成;
  • 自动运营;
  • 长链路审批;
  • 多系统同步。

于是:

AI 应用开始进入异步时代。

它需要:

  • task queue;
  • event bus;
  • checkpoint;
  • resume;
  • notification;
  • retry;
  • distributed execution。

这时候:

AI App
越来越像后端系统。

十二、为什么 Runtime 会成为核心竞争力

过去:

模型能力
决定 AI 上限

未来:

Runtime 能力
决定 AI 产品体验

因为:

  • 谁更会调度;
  • 谁更会管理 memory;
  • 谁更会控制 context;
  • 谁更会做 tool orchestration;
  • 谁更会做 fallback;
  • 谁更会做 recovery;
  • 谁更会做 tracing;
  • 谁更会做 eval;

都会直接决定:

Agent 是否稳定。

未来真正强的 AI 公司,很可能不是:

“谁模型最大”

而是:

“谁 runtime 最成熟”。

十三、AI 开发范式正在变化

传统开发:

写业务逻辑

AI 开发:

设计运行系统

过去工程师主要关心:

  • API;
  • 数据库;
  • 页面;
  • 缓存;
  • 权限。

未来 AI 工程师会越来越关注:

  • prompt;
  • memory;
  • context;
  • state;
  • tool;
  • eval;
  • trace;
  • orchestration;
  • runtime;
  • agent lifecycle。

所以: AI 工程正在从“接口工程”,进入“运行时工程”。

十四、未来的 AI App 会越来越像“数字员工”

这一点其实已经越来越明显,未来很多 AI 应用,不再像:

工具软件

而更像:

数字员工

它会:

  • 接任务;
  • 做计划;
  • 调工具;
  • 写结果;
  • 处理异常;
  • 请求人工确认;
  • 长期记忆;
  • 自主协作。

于是:

AI 系统
开始从“软件”
变成“组织能力”。

十五、从模型到智能体,本质是一次系统升级

很多人把 Agent 理解成:

大模型 + tools

但真正的 Agent 远不止如此。它本质上是:AI 系统的一次架构升级。

从:

单次生成

进入:

长期运行

从:

模型推理

进入:

系统执行

从:

Prompt

进入:

Runtime

从:

聊天

进入:

工作

总结

AI 应用正在发生一次非常深的范式变化,过去:

模型 = AI 应用

未来:

模型
只是 AI Runtime 中的一个组件。

真正的下一代 AI 系统,会越来越强调:

  • memory;
  • runtime;
  • orchestration;
  • tool use;
  • state machine;
  • execution;
  • observability;
  • recovery;
  • multi-agent;
  • asynchronous workflow。

所以从模型到智能体,本质上不是一次产品升级。

而是:

AI 从“生成工具”进入“执行系统”的开始。

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐