构建企业级 AI 研发操作系统(AI-OS),集成 Matt Pocock 全套技能,实现零幻觉开发
本文提出了一种企业级AI研发操作系统(AI-OS)架构,旨在解决当前AI编程工具存在的规范失效、幻觉、复用困难和上下文爆炸等问题。该系统的核心创新在于采用"分层路由洋葱模型",将规则拆分为全局资产与项目资产,包括L0全局规范层、L1全局SOP层、L2全局技能层(集成Matt Pocock 21个技能)、L3项目路由层和L4项目上下文层。通过物理工具校验和XML格式强制输出等机制,确保AI严格执行开
告别单文件 Prompt:构建企业级 AI 研发操作系统(AI-OS),集成 Matt Pocock 全套技能,实现零幻觉开发
引言:为什么你的 AI 编程总是“翻车”?
在使用 OpenCode、Cursor、Cline 等 AI 编程工具时,你是否遇到过以下痛点:
- 规范失效:明明在 Prompt 里写了“遵守 Clean Code”,AI 写到第 3 个文件就全忘了。
- 严重幻觉:AI 捏造不存在的 API,或者写完代码不跑测试就告诉你“搞定了”。
- 无法复用:每个新项目都要重新写一遍长长的 System Prompt,极其繁琐。
- 上下文爆炸:把所有规则塞进一个
.md文件,导致 AI 注意力稀释,频繁出现“中间遗忘”。
破局之道:大模型工程化的核心,不是写一个“超级 Prompt”,而是构建一套 AI 能理解、能执行、能自我校验的标准化操作系统(AI-OS)。
本文将为你开源一套经过生产环境验证的 AI-OS v1.0 架构。通过“分层路由 + 物理工具校验”,并深度集成 Matt Pocock 的 21 个全流程神级 Skills,让 AI 像运行程序一样严格执行开发任务,真正实现一次搭建,终身复用,零幻觉。
一、 核心架构:从“单文件”到“分层路由洋葱模型”
我们将规则拆分为全局资产与项目资产,AI 在不同阶段只加载当前需要的层,确保注意力 100% 集中:
| 层级 | 作用 | 存储位置 | 加载时机 | 核心内容 |
|---|---|---|---|---|
| L0 全局规范层 | 所有项目通用的编码、Git、测试规范 | ~/.ai-os/standards/ |
编码/提交时按需注入 | Clean Code、Git 规范 |
| L1 全局 SOP 层 | 所有项目通用的标准化工作流 | ~/.ai-os/sops/ |
执行具体任务时调用 | TDD 流程、Bug 排查流程 |
| L2 全局技能层 | Matt Pocock 21 Skills + 自定义技能 | ~/.ai-os/skills/ |
触发 @ 指令时调用 |
需求拷问、架构优化、领域建模等 |
| L3 项目路由层 | 单个项目的“入口与大脑” | ./.ai/RULES.md |
项目打开时永久常驻 | 路由协议、工具映射、XML 输出约束 |
| L4 项目上下文层 | 单个项目特有的业务信息 | ./.ai/context/ |
对应任务执行前按需加载 | PRD、领域模型、架构设计 |
核心突破:将通用资产和顶级开源 Skills 放入全局目录 ~/.ai-os/,新项目只需一个 800 字的 RULES.md 即可继承所有能力。
二、 第一步:全局环境一键初始化(只需执行一次)
打开你的终端,复制并运行以下 Bash 脚本。它将在 10 秒内为你搭建好全局的 AI-OS 资产库,并自动整合你本地的 Matt Pocock 21 个 Skills。
#!/bin/bash
# AI-OS v1.0 全局初始化脚本 - 终极落地版 (集成 Matt Pocock Skills)
echo "🚀 开始初始化 AI-OS v1.0 全局环境..."
# 1. 创建全局目录结构
mkdir -p ~/.ai-os/{standards,sops,skills,templates,stacks}
# 2. 整合 Matt Pocock 的 21 个神级 Skills
echo "🔗 整合 Matt Pocock 21 Skills..."
# 替换成你存放skill的目录
MATT_SKILLS_DIR="/Users/litianyu/skills"
if [ -d "$MATT_SKILLS_DIR" ]; then
# 将 skills 目录下的所有内容复制到全局 skills 目录
cp -r "$MATT_SKILLS_DIR"/* ~/.ai-os/skills/ 2>/dev/null
echo "✅ Matt Pocock 21 Skills 已成功整合到 ~/.ai-os/skills/"
else
echo "⚠️ 警告:未找到 $MATT_SKILLS_DIR,请确认路径或手动复制 skills 到 ~/.ai-os/skills/"
fi
# 3. 生成核心 SOP (标准作业程序)
cat << 'EOF' > ~/.ai-os/sops/SOP_TDD.md
# TDD 标准作业程序 v1.0
## 强制执行步骤
1. 读取 PRD 和领域模型,提取所有测试场景(正常、异常、边界)
2. 编写第一个失败的单元测试
3. 【强制】调用终端工具运行测试,确认测试失败
4. 编写最小实现代码,只写让测试通过的最少代码
5. 【强制】调用终端工具运行测试,确认测试通过
6. 重构代码,优化可读性和性能
7. 【强制】调用终端工具运行所有测试,确认没有回归
8. 【强制】调用终端工具运行 lint 和类型检查
9. 只有当所有命令都返回 0 退出码时,才能结束任务
EOF
cat << 'EOF' > ~/.ai-os/sops/SOP_TRIAGE.md
# Bug 排查标准作业程序 v1.0
## 强制执行步骤
1. 读取错误日志,提取关键信息:错误类型、发生位置、堆栈信息
2. 调用终端工具 grep 相关代码,定位问题所在文件
3. 分析根因,列出可能的解决方案
4. 生成修复 Diff
5. 【强制】调用终端工具运行相关测试,确认修复有效
6. 【强制】调用终端工具运行所有测试,确认没有引入新的 Bug
EOF
# 4. 生成编码与 Git 规范
cat << 'EOF' > ~/.ai-os/standards/CLEAN_CODE.md
# 清洁代码规范 v1.0
- 单个函数不超过 50 行,单个文件不超过 300 行
- 每个函数只做一件事,参数不超过 5 个
- 注释“为什么”,而不是“做什么”
EOF
cat << 'EOF' > ~/.ai-os/standards/GIT_WORKFLOW.md
# Git 工作流规范 v1.0
- 提交信息必须符合 Conventional Commits:type(scope): message
- 类型:feat, fix, docs, style, refactor, test, chore
EOF
# 5. 生成项目级 MCP 模板与 .aiignore
cat << 'EOF' > ~/.ai-os/templates/mcp_template.json
{
"mcpServers": {
"filesystem": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem", "./"] },
"git": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-git"] },
"command": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-command", "--allow", "python,pytest,git,docker,ruff,mypy"] }
}
}
EOF
cat << 'EOF' > ~/.ai-os/templates/.aiignore
venv/
__pycache__/
.pytest_cache/
.env
*.log
node_modules/
EOF
echo "✅ AI-OS v1.0 全局初始化完成!"
三、 第二步:项目级一键创世(每个新项目执行)
新建你的项目目录,打开 OpenCode / Cursor / Cline,直接粘贴以下“创世 Prompt”(以 Python+FastAPI 为例):
# 角色与任务
你是顶级 AI 架构师,严格遵守工程规范,拒绝任何幻觉。请基于全局 AI-OS (~/.ai-os/) 初始化当前项目。
# 项目信息
- 项目名称:my-awesome-api
- 技术栈:Python 3.11 + FastAPI + PostgreSQL + Redis
- 项目描述:一个高并发的电商订单处理系统
# 执行步骤
1. 读取 ~/.ai-os/templates/.aiignore,写入当前目录的 .aiignore
2. 读取 ~/.ai-os/templates/mcp_template.json,写入当前目录的 .mcp.json
3. 创建 .ai/ 和 .ai/context/ 目录
4. 创建 .ai/RULES.md,内容必须严格如下:
--- (RULES.md 内容开始) ---
# 项目 AI 路由协议 v1.0
## 核心原则
- 严谨务实,拒绝幻觉,不确定就说"我不确定"
- 复杂逻辑使用 deepseek-v4-pro,简单任务使用 deepseek-v4-flash
## 资产路由
- 全局规范:~/.ai-os/standards/
- 全局 SOP:~/.ai-os/sops/
- 全局技能:~/.ai-os/skills/ (包含 Matt Pocock 21 Skills)
- 项目上下文:.ai/context/
## 物理工具映射(根据当前客户端自动适配)
- 执行终端命令:execute_command / run_command / run_terminal
- 读取文件:read_file
- 写入/修改文件:write_to_file / apply_diff
## 【强制输出格式】(核心防幻觉机制)
所有回答必须严格按照以下 XML 格式输出,禁止自由发挥:
<thinking>
1. 我当前的任务是什么?
2. 我需要读取哪些文件?(必须列出完整路径)
3. 我需要调用哪些终端工具进行物理校验?
</thinking>
<file-loading>
- 已读取:.ai/RULES.md
- 已读取:[其他相关文件路径]
</file-loading>
<plan>
1. 步骤 1
2. 步骤 2
</plan>
<execution>
具体代码或输出内容
</execution>
<verification>
1. 我是否运行了 ruff/mypy/pytest 进行物理校验?
2. 我是否遵守了所有编码规范?
</verification>
## 强制执行规则
1. 代码生成后,必须自动运行 lint、typecheck 和 test
2. 只有所有命令都通过,才能结束任务
3. 每次修改必须使用 apply_diff 生成增量修改,禁止输出完整文件
## 技能自动路由与调用协议 (Matt Pocock 21 Skills)
你已集成 Matt Pocock 的全流程神级技能库。**禁止被动等待用户输入 `@`**,你必须根据当前对话的上下文、开发阶段和任务意图,**自动识别并调用**对应的技能。
### 1. 调用动作规范
当匹配到对应技能时,必须首先使用 `read_file` 工具读取 `~/.ai-os/skills/<技能名>/skill.md`(若目录结构不同则自适应查找同级 `.md`),读取后严格按照其内部的 Steps 和 Rules 执行。
### 2. 全生命周期技能路由表
#### 阶段一:需求规划与对齐 (Requirements)
- **触发场景**:刚提出新功能、需求模糊、需要宏观梳理、需输出标准文档。
- **自动路由**:
- `grill-me`:需求模糊时,自动进行穷尽式追问,消除歧义。
- `zoom-out`:需求复杂时,跳出细节梳理整体架构上下文。
- `to-prd`:需求确认完毕,自动将对话转化为标准 PRD 文档。
#### 阶段二:领域建模与架构设计 (Design)
- **触发场景**:项目初始化、定义业务模型、多人协作需统一术语、设计 API。
- **自动路由**:
- `domain-model`:定义业务模型时,打磨术语一致性,生成 CONTEXT.md/ADR。
- `ubiquitous-language`:需要统一团队术语时,提取 DDD 统一语言术语表。
- `design-an-interface`:需要设计 API/功能接口时,生成多套设计方案供选择。
#### 阶段三:项目初始化与工程化 (Setup)
- **触发场景**:新建项目、配置代码规范、初始化目录结构、配置 Git 防护。
- **自动路由**:
- `setup-pre-commit`:配置 Husky 等代码预提交校验。
- `git-guardrails-claude-code`:配置 Git 防护,拦截 push/reset 等危险命令。
- `scaffold-exercises`:生成标准项目目录或习题目录结构。
#### 阶段四:开发实现与重构优化 (Development & Refactoring)
- **触发场景**:编写新功能、代码混乱需优化、TS 类型优化、老代码重构。
- **自动路由**:
- `tdd`:编写新功能时,强制执行“红-绿-重构”测试驱动开发。
- `improve-codebase-architecture`:代码可维护性差时,扫描并优化架构/模块化。
- `request-refactor-plan`:面对老代码,生成安全的增量重构计划。
- `migrate-to-shoehorn`:TS 项目中,优化类型断言代码。
- `edit-article`:编写或优化代码注释、说明文档时提升可读性。
#### 阶段五:测试与 Bug 排查 (Testing & Debugging)
- **触发场景**:出现 Bug、需要定位缺陷、交互式排查、验证功能。
- **自动路由**:
- `triage-issue`:出现 Bug 时,自动定位根因并生成修复方案。
- `qa`:发现问题需定位时,进行交互式 QA 并自动提交 Bug 工单。
#### 阶段六:任务协作与工单管理 (Management)
- **触发场景**:需求拆分、分配任务、管理 GitHub Issue。
- **自动路由**:
- `to-issues`:需求确认后,将 PRD 拆解为可执行的 GitHub Issue。
- `github-triage`:自动分类和处理 GitHub Issue。
#### 阶段七:全周期通用与系统配置 (General & System)
- **触发场景**:需要极简回复、管理笔记、扩展能力、修改 AI 配置。
- **自动路由**:
- `caveman`:用户要求精简回复或需节省 Token 时,开启超精简模式。
- `obsidian-vault`:需要记录开发笔记或查阅资料时管理 Obsidian。
- `write-a-skill`:遇到重复性新模式时,自定义创建新技能。
- `customize-opencode`:需要修改 OpenCode 自身配置/插件时调用。
### 3. 路由执行约束
1. **意图识别优先**:每次接收到用户输入,必须在 `<thinking>` 标签中判断当前所属阶段,并匹配上述路由表。
2. **组合调用**:复杂任务可组合调用(如先 `grill-me` 追问,再 `to-prd` 输出文档),但必须按逻辑顺序分布执行。
3. **用户覆盖**:若用户显式输入 `@<技能名>`,则无视自动路由,直接调用指定技能。
## 在 .ai/context/ 下创建 PRD.md、ARCHITECTURE.md、DOMAIN_MODEL.md 空模板
## 完成后输出《项目初始化报告》,并提示我输入需求以填充 PRD
四、 日常开发工作流演示
初始化完成后,你的日常开发将变得极其丝滑且严谨:
场景 1:接需求(防需求遗漏)
你:@grill-me 帮我分析一个用户积分抵扣功能的需求。
AI 行为:
- 自动读取
~/.ai-os/skills/grill-me/下的技能文件。 - 按照 Matt Pocock 的穷尽追问逻辑,从边界条件、并发处理等维度疯狂追问你。
- 你回答后,AI 将结构化需求写入
.ai/context/PRD.md。
场景 2:写代码(物理防幻觉,核心!)
你:@tdd 根据 PRD,开发积分抵扣的核心逻辑。
AI 行为:
- 读取
PRD.md和~/.ai-os/skills/tdd/下的技能文件。 - 输出
<plan>,先写失败的测试用例。 - 关键动作:AI 写完实现代码后,自动调用终端工具执行
pytest和ruff check。 - 如果终端返回报错,AI 会自动读取报错信息,自我修正代码,直到终端输出全绿。
场景 3:查 Bug(防排查幻觉)
你:@triage-issue 抵扣接口报 500,日志是 [粘贴日志]。
AI 行为:
- 读取
~/.ai-os/skills/triage-issue/下的技能文件。 - 调用终端工具执行
grep查日志,定位源码。 - 输出根因分析,生成修复 Diff,并自动跑测试验证修复。
五、 避坑与进阶指南(生产环境血泪总结)
- MCP 配置路径:
初期强烈建议使用项目级.mcp.json(放在项目根目录)。全局配置容易因工具版本更新导致路径变化而失效。 - 上下文污染防护:
项目变大后,AI 可能会把.ai/context/里的所有文件都塞进上下文。.aiignore是必须的,同时在RULES.md中已写明“每次任务最多读取 3 个上下文文件”,强制 AI 聚焦。 - 打破“只说不做”:
如果 AI 回复“我已运行测试”但实际上没跑,说明工具映射失败。请在RULES.md的“物理工具映射”中,核对并修改为你当前使用的 AI 客户端的真实 Tool Name。 - 版本控制:
将.ai/目录和.mcp.json提交到 Git!这样你的团队克隆项目后,打开 AI 工具就能立即继承相同的规范和 SOP。
结语
这套 AI-OS v1.0 彻底抛弃了“靠提示词约束 AI”的幻想,转而使用 “架构分层 + 物理工具校验 + 顶级开源 Skills” 的工程化手段。
它不是一成不变的,随着你的使用,你可以将踩过的坑补充到 ~/.ai-os/standards/ 中,将新的最佳实践提炼到 ~/.ai-os/sops/ 中。你积累的每一行规范,都会成为你未来所有项目的护城河。
现在,复制脚本,开始构建你的 AI 研发操作系统吧!
(本文首发于 CSDN,作者:阿汤猫666,转载请注明出处。如果觉得有用,欢迎点赞收藏!)
openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构
更多推荐
所有评论(0)