【Agent Harness】从“提示词玩具”到“认知操作系统”：Gliding Horse 如何重新定义 AI Agent

找死的豆腐

10人浏览 · 2026-06-29 18:58:57

找死的豆腐 · 2026-06-29 18:58:57 发布

从“提示词玩具”到“认知操作系统”：Gliding Horse 如何重新定义 AI Agent

几个月前，我在做一个多 Agent 协作的软件工程实验时，被市面上的 AI 编码工具折磨得够呛。Claude Code 聊了 20 轮忘了第 3 轮的约定，Codex CLI 在多个任务间切换时状态全丢，OpenClaw 的 Skill 管理一多就变成灾难……这些工具都很强，但都像“聪明但散漫的实习生”——你需要时刻盯着，关键事情还得自己把关。

于是我决定自己动手。不是写一个 Prompt 模板或编排脚本，而是从零构建一个 AI Agent 操作系统。它叫 Gliding Horse（流马），全部用 Rust 写成，内核级硬约束，图数据库当大脑，JSON‑LD 当语言。

今天我就把它的核心设计扒开给你看，以及它和 Claude Code、OpenAI Codex、OpenClaw、Hermes 这些当红工具的本质区别到底在哪。

一、与市面上 Agent 的基因差异

先把结论放在最前面：Gliding Horse 与 Claude Code、Codex CLI、OpenClaw、Hermes 等工具不在同一个品类。

维度	Claude Code	Codex CLI	OpenClaw	Hermes	Gliding Horse
定位	编码助手（Agent Runtime）	终端 AI Agent	插件化 Agent 网关	自进化个人 Agent 框架（常驻+消息平台+跨会话）	Agent 操作系统
语言	TypeScript	Python	Node.ts（6452+ TS）	Python 3.11+ 主业务 + Node.js 工具链/Electron	Rust
记忆	会话文件 + MEMORY.md 自动记忆 + AutoDream 跨会话巩固	会话内上下文 + AGENTS.md 注入（偏薄）	插件内部状态 + `~/.openclaw` 本地	SQLite FTS5 会话 + 策展 MD + Honcho 可插拔 6 provider	L0-L3 四层图记忆 + MESI 一致性
数据模型	文本流 + 工具 JSON	文本/JSON	JSON + WS-RPC Schema	JSON + SQLite + Markdown(Skill)	JSON-LD 语义图 + IRI 统一地址总线
安全约束	Prompt 软约束 + Permission Mode + Hooks	macOS sandbox-exec + TOML 审批 + Prompt	自托管 + 插件权限（配置级）	凭据池轮换 + 保护目录 + secret 扫描 + 按钮审批(fail-closed)	系统调用门 + ToolGuard 硬拦截 + SHACL 契约
多 Agent	Subagent 隔离（.claude/agents/ YAML）	Subagent 隔离（线程+沙箱，max_threads=6）	Skills 间接派 + SOUL.md 人格	delegate_tool 委托 + batch_runner 并行 + cron	SA 动态编排 + L2 共享黑板 + 态势感知
知识管理	CLAUDE.md + MEMORY.md + skills（被动）	AGENTS.md + codex.md	Skills 插件（73 官方+52 内置）	自进化 Skill 闭环（agentskills.io，~/.hermes/skills/）	技能图谱 + 知识图谱 + 自进化 Batch Agent
质量保障	人工审查	人工审查	无	无	阶段门禁 + 自工程完结 + 根因引擎

简单说：Claude Code、Codex CLI 是“AI 编码工具”，Gliding Horse 是“运行这些 AI 编码工具的操作系统”。 前者负责聪明，后者负责让聪明变得可靠。

二、Gliding Horse 的核心架构

Gliding Horse 的核心理念非常简单：把 LLM 当成 CPU，给它配上缓存、内存、文件系统、权限管理和进程调度。

双核心引擎

调度指令 / 上下文需求

基础设施

工具系统
ToolExecutor / MCP 集成
结果路由 / 微工具生成

质量门禁
SyscallGate 三层校验
ToolGuard 拦截
StageGate + SHACL

事件总线
TypeMask 位图路由
Agent 间通信

知识沉淀

技能图谱
JSON‑LD 技能网络
MOC 导航 / 渐进披露

知识图谱
实体 / 关系 / 代码AST

知识-技能桥接
实体 ↔ 技能关联

后台整理 Agent (8个)
技能合并 / 实体解析
失败挖掘 / 记忆压缩

记忆系统

L2 黑板
Oxigraph 内存图
多 Agent 共享
Agent 态势 + 资源锁

L3 投影引擎
SPARQL CONSTRUCT
按需加载子图

L0 持久化
Oxigraph + sled
全量记忆 + JSON‑LD

MESI 缓存一致性协议

感知系统

5W2H 解析器
态势感知
健康监控
模式识别
冲突检测
工作区文件监控

接口层

用户 / 工作流引擎

MCP 适配器
外部工具接入

Agent 编排引擎
SA 调度器 + 动态PDCA
角色工厂 PA/DA/CA/AA

上下文管理引擎
L1窗口组装
摘要/IRI注入
Token预算控制

架构的核心思想是：编排器决定“谁在什么时候干什么”，上下文引擎决定“LLM 看到什么”，而其他所有模块——感知、记忆、知识、工具、质量——都是为这两个核心供血的循环系统。

三、七大“人无我有”的亮点设计

亮点一：CPU 缓存式四层记忆

传统 Agent 的记忆是“全量塞进上下文，超出就截断”。Gliding Horse 则直接抄袭了 CPU 的多级缓存架构：

L1（上下文窗口）：仅保留摘要 + IRI 指针，Token 恒定。
L2（共享黑板）：多 Agent 共享的 Oxigraph 内存图，MESI 协议保证并发一致性。
L3（投影引擎）：按需从 L0 抓取子图，像 MMU 一样换页。
L0（持久化）：Oxigraph 持久化 + sled + Hyperspace 双空间向量引擎。

效果：聊了 50 轮，上下文只有 50 条摘要，但任意历史细节都可以通过 IRI 秒级调取。Token 消耗从 O(n) 降为 O(1)。

亮点二：JSON‑LD 统一语义总线

Gliding Horse 中没有任何“字符串数据”——所有任务、技能、记忆、设计文档、审计日志全是带 @id 的 JSON‑LD 节点。

鸭子类型：一个 Skill 的参数叫 input_file，另一个叫 source_url，通过 @context 自动映射到同一个语义 IRI，零成本对接。
自动去重：两个 Agent 写入同一 IRI 的数据在图数据库中自动合并。
Token 捏合：同一份图数据可按需全展开或仅返回 IRI 引用，精细控制上下文大小。

亮点三：硬约束质量门禁

Gliding Horse 不相信 Prompt 里的“你必须”“你应该”。它用系统调用门（Syscall Gate）做三层硬拦截：

JSON Schema 校验：参数格式不合规直接驳回。
Ed25519 签名验证：被篡改过的 Skill 直接拒绝加载。
角色白名单：PA 只能读，DA 可读写，CA 可审计。

工具调用时还有 ToolGuard 做前置注入和后置校验，发现敏感文件读取直接 Abort 并发送纠正消息。阶段流转时 SHACL 契约校验产出物，不合格直接打回。

这套机制借鉴了丰田的“自工程完结”——不接收缺陷、不制造缺陷、不流出缺陷。

亮点四：动态 PDCA 编排

Gliding Horse 的 SA 调度器不是一个静态 DAG 引擎。它会分析任务 5W2H，动态决定执行拓扑：

简单查询 → 只派一个 DA
标准分析 → PA → DA → CA
复杂项目 → PA → 三个 DA 并行 → CA → AA
探索研究 → DA ↔ CA 循环直到收敛

这不是人编的 YAML，是 SA 实时推理的结果。每个 Agent 的提示词动态生成，Skill 按需从知识图谱加载。

亮点五：技能图谱 + 知识图谱桥接

Skill 不再是 Markdown 文件，而是 JSON‑LD 节点组成的可遍历网络，包含 6 种语义链接类型（前置依赖、组合、关联、替代、扩展、泛化）。MOC（内容地图）节点提供导航入口。

知识图谱存实体和关系，桥接层连接“知识实体”和“技能”。Agent 调用一个技能时，可以顺藤摸瓜获取该技能相关的历史经验、已知失败模式、适用场景。

亮点六：上下文 Token 经济学

Gliding Horse 的上下文管理是一套纵深防御体系：

工具结果 IRI 化：大工具结果自动存档到 L0，上下文只保留摘要 + IRI + 微工具，缩减 98%+。
跨轮摘要引用化：截断时不是一句“之前已执行 5 轮”，而是结构化列出每轮的关键动作和 IRI 引用。
语义淘汰：淘汰低相关度条目时基于向量相似度计算，不误删关键信息。

亮点七：后台自进化与 Batch Agent

Gliding Horse 内置 8 个“保洁阿姨”——Batch Agent，定时做技能合并、实体解析、失败模式挖掘、记忆压缩、模板效果分析。系统越用越聪明，不是因为 LLM 变强了，而是因为知识图谱在持续自我优化。

四、一个真实的开发场景

在开发 Gliding Horse 的“行为工程系统”时，我只给了 SA 一句话：“实现一个 RootCauseEngine，当 Agent 执行出错时自动进行 5 级回溯追踪。”

SA 自己分析了 5W2H，决定走 PA → DA → CA。PA 去技能图谱里找到相关的 Skill，生成了执行计划。DA 写代码时，工作区监控系统显示依赖文件都是 read_fresh。CA 发现 trace_backward() 缺少置信度阈值检查，打回。DA 修正后重新提交，CA 通过。AA 把“几何平均比算术平均更能防止单项高分掩盖薄弱环节”作为经验碎片写入知识图谱。

整个过程中，我只给了起始指令。规划、执行、检查、修正、归档全是系统自己完成的。

五、Gliding Horse 不是谁的替代品

它不是要替代 Claude Code 或 Codex CLI。相反，它可以成为运行这些工具的底层平台——把它们的聪明才智装进一套有记忆、有约束、有质量保障的工程体系里。

Claude Code 的 Workflow 是一个可复用的命令模板。Gliding Horse 的 PDCA 是实时推理的认知调度器。

Codex CLI 的 Subagent 隔离执行。Gliding Horse 的 Subagent 通过 L2 黑板实时同步状态，边执行边协调。

OpenClaw 的 Skills 是插件配置。Gliding Horse 的 Skill 是语义网络节点，可遍历、可发现、可进化。

Hermes 的模块化是代码级组合。Gliding Horse 的模块化是操作系统的分层架构。

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

Linux操作系统

虚拟机（Virtual Machine, VM）是在物理计算机上通过软件模拟出的一台“虚拟电脑”，它拥有独立的 CPU、内存、硬盘、网卡等资源，可运行独立的操作系统，互不影响。打开 VirtualBox → “新建” → 命名（如 Ubuntu20.04）→ 类型选“Linux” → 版本选“Ubuntu (64-bit)”“设置” → “存储” → 点击光盘图标 → 选择“选择虚拟光盘文件”

openEuler 社区

汇编中寄存器寻址与立即数寻址混淆问题解决

很多编程初学者提起汇编语言，第一印象就是晦涩难懂、老旧无用，觉得在Python、Java、Go等高级语言普及的今天，汇编早已被时代淘汰。但事实上，汇编语言是打通计算机底层逻辑的关键钥匙，无论是系统开发、逆向安全、嵌入式编程，还是优化程序性能，都离不开汇编的底层支撑。操作系统内核、编译器底层、游戏引擎核心模块、实时嵌入式系统等对性能、延时要求极高的场景，都会用汇编对关键代码进行优化，压榨硬件的最大性