告别单文件 Prompt:构建企业级 AI 研发操作系统(AI-OS),集成 Matt Pocock 全套技能,实现零幻觉开发

引言:为什么你的 AI 编程总是“翻车”?

在使用 OpenCode、Cursor、Cline 等 AI 编程工具时,你是否遇到过以下痛点:

  1. 规范失效:明明在 Prompt 里写了“遵守 Clean Code”,AI 写到第 3 个文件就全忘了。
  2. 严重幻觉:AI 捏造不存在的 API,或者写完代码不跑测试就告诉你“搞定了”。
  3. 无法复用:每个新项目都要重新写一遍长长的 System Prompt,极其繁琐。
  4. 上下文爆炸:把所有规则塞进一个 .md 文件,导致 AI 注意力稀释,频繁出现“中间遗忘”。

破局之道:大模型工程化的核心,不是写一个“超级 Prompt”,而是构建一套 AI 能理解、能执行、能自我校验的标准化操作系统(AI-OS)

本文将为你开源一套经过生产环境验证的 AI-OS v1.0 架构。通过“分层路由 + 物理工具校验”,并深度集成 Matt Pocock 的 21 个全流程神级 Skills,让 AI 像运行程序一样严格执行开发任务,真正实现一次搭建,终身复用,零幻觉


一、 核心架构:从“单文件”到“分层路由洋葱模型”

我们将规则拆分为全局资产与项目资产,AI 在不同阶段只加载当前需要的层,确保注意力 100% 集中:

层级 作用 存储位置 加载时机 核心内容
L0 全局规范层 所有项目通用的编码、Git、测试规范 ~/.ai-os/standards/ 编码/提交时按需注入 Clean Code、Git 规范
L1 全局 SOP 层 所有项目通用的标准化工作流 ~/.ai-os/sops/ 执行具体任务时调用 TDD 流程、Bug 排查流程
L2 全局技能层 Matt Pocock 21 Skills + 自定义技能 ~/.ai-os/skills/ 触发 @ 指令时调用 需求拷问、架构优化、领域建模等
L3 项目路由层 单个项目的“入口与大脑” ./.ai/RULES.md 项目打开时永久常驻 路由协议、工具映射、XML 输出约束
L4 项目上下文层 单个项目特有的业务信息 ./.ai/context/ 对应任务执行前按需加载 PRD、领域模型、架构设计

核心突破:将通用资产和顶级开源 Skills 放入全局目录 ~/.ai-os/,新项目只需一个 800 字的 RULES.md 即可继承所有能力。


二、 第一步:全局环境一键初始化(只需执行一次)

打开你的终端,复制并运行以下 Bash 脚本。它将在 10 秒内为你搭建好全局的 AI-OS 资产库,并自动整合你本地的 Matt Pocock 21 个 Skills

#!/bin/bash
# AI-OS v1.0 全局初始化脚本 - 终极落地版 (集成 Matt Pocock Skills)

echo "🚀 开始初始化 AI-OS v1.0 全局环境..."

# 1. 创建全局目录结构
mkdir -p ~/.ai-os/{standards,sops,skills,templates,stacks}

# 2. 整合 Matt Pocock 的 21 个神级 Skills
echo "🔗 整合 Matt Pocock 21 Skills..."
# 替换成你存放skill的目录
MATT_SKILLS_DIR="/Users/litianyu/skills"
if [ -d "$MATT_SKILLS_DIR" ]; then
    # 将 skills 目录下的所有内容复制到全局 skills 目录
    cp -r "$MATT_SKILLS_DIR"/* ~/.ai-os/skills/ 2>/dev/null
    echo "✅ Matt Pocock 21 Skills 已成功整合到 ~/.ai-os/skills/"
else
    echo "⚠️ 警告:未找到 $MATT_SKILLS_DIR,请确认路径或手动复制 skills 到 ~/.ai-os/skills/"
fi

# 3. 生成核心 SOP (标准作业程序)
cat << 'EOF' > ~/.ai-os/sops/SOP_TDD.md
# TDD 标准作业程序 v1.0
## 强制执行步骤
1. 读取 PRD 和领域模型,提取所有测试场景(正常、异常、边界)
2. 编写第一个失败的单元测试
3. 【强制】调用终端工具运行测试,确认测试失败
4. 编写最小实现代码,只写让测试通过的最少代码
5. 【强制】调用终端工具运行测试,确认测试通过
6. 重构代码,优化可读性和性能
7. 【强制】调用终端工具运行所有测试,确认没有回归
8. 【强制】调用终端工具运行 lint 和类型检查
9. 只有当所有命令都返回 0 退出码时,才能结束任务
EOF

cat << 'EOF' > ~/.ai-os/sops/SOP_TRIAGE.md
# Bug 排查标准作业程序 v1.0
## 强制执行步骤
1. 读取错误日志,提取关键信息:错误类型、发生位置、堆栈信息
2. 调用终端工具 grep 相关代码,定位问题所在文件
3. 分析根因,列出可能的解决方案
4. 生成修复 Diff
5. 【强制】调用终端工具运行相关测试,确认修复有效
6. 【强制】调用终端工具运行所有测试,确认没有引入新的 Bug
EOF

# 4. 生成编码与 Git 规范
cat << 'EOF' > ~/.ai-os/standards/CLEAN_CODE.md
# 清洁代码规范 v1.0
- 单个函数不超过 50 行,单个文件不超过 300 行
- 每个函数只做一件事,参数不超过 5 个
- 注释“为什么”,而不是“做什么”
EOF

cat << 'EOF' > ~/.ai-os/standards/GIT_WORKFLOW.md
# Git 工作流规范 v1.0
- 提交信息必须符合 Conventional Commits:type(scope): message
- 类型:feat, fix, docs, style, refactor, test, chore
EOF

# 5. 生成项目级 MCP 模板与 .aiignore
cat << 'EOF' > ~/.ai-os/templates/mcp_template.json
{
  "mcpServers": {
    "filesystem": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-filesystem", "./"] },
    "git": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-git"] },
    "command": { "command": "npx", "args": ["-y", "@modelcontextprotocol/server-command", "--allow", "python,pytest,git,docker,ruff,mypy"] }
  }
}
EOF

cat << 'EOF' > ~/.ai-os/templates/.aiignore
venv/
__pycache__/
.pytest_cache/
.env
*.log
node_modules/
EOF

echo "✅ AI-OS v1.0 全局初始化完成!"

三、 第二步:项目级一键创世(每个新项目执行)

新建你的项目目录,打开 OpenCode / Cursor / Cline,直接粘贴以下“创世 Prompt”(以 Python+FastAPI 为例):

# 角色与任务
你是顶级 AI 架构师,严格遵守工程规范,拒绝任何幻觉。请基于全局 AI-OS (~/.ai-os/) 初始化当前项目。

# 项目信息
- 项目名称:my-awesome-api
- 技术栈:Python 3.11 + FastAPI + PostgreSQL + Redis
- 项目描述:一个高并发的电商订单处理系统

# 执行步骤
1. 读取 ~/.ai-os/templates/.aiignore,写入当前目录的 .aiignore
2. 读取 ~/.ai-os/templates/mcp_template.json,写入当前目录的 .mcp.json
3. 创建 .ai/ 和 .ai/context/ 目录
4. 创建 .ai/RULES.md,内容必须严格如下:

--- (RULES.md 内容开始) ---
# 项目 AI 路由协议 v1.0
## 核心原则
- 严谨务实,拒绝幻觉,不确定就说"我不确定"
- 复杂逻辑使用 deepseek-v4-pro,简单任务使用 deepseek-v4-flash

## 资产路由
- 全局规范:~/.ai-os/standards/
- 全局 SOP:~/.ai-os/sops/
- 全局技能:~/.ai-os/skills/ (包含 Matt Pocock 21 Skills)
- 项目上下文:.ai/context/

## 物理工具映射(根据当前客户端自动适配)
- 执行终端命令:execute_command / run_command / run_terminal
- 读取文件:read_file
- 写入/修改文件:write_to_file / apply_diff

## 【强制输出格式】(核心防幻觉机制)
所有回答必须严格按照以下 XML 格式输出,禁止自由发挥:
<thinking>
1. 我当前的任务是什么?
2. 我需要读取哪些文件?(必须列出完整路径)
3. 我需要调用哪些终端工具进行物理校验?
</thinking>

<file-loading>
- 已读取:.ai/RULES.md
- 已读取:[其他相关文件路径]
</file-loading>

<plan>
1. 步骤 1
2. 步骤 2
</plan>

<execution>
具体代码或输出内容
</execution>

<verification>
1. 我是否运行了 ruff/mypy/pytest 进行物理校验?
2. 我是否遵守了所有编码规范?
</verification>

## 强制执行规则
1. 代码生成后,必须自动运行 lint、typecheck 和 test
2. 只有所有命令都通过,才能结束任务
3. 每次修改必须使用 apply_diff 生成增量修改,禁止输出完整文件

## 技能自动路由与调用协议 (Matt Pocock 21 Skills)
你已集成 Matt Pocock 的全流程神级技能库。**禁止被动等待用户输入 `@`**,你必须根据当前对话的上下文、开发阶段和任务意图,**自动识别并调用**对应的技能。

### 1. 调用动作规范
当匹配到对应技能时,必须首先使用 `read_file` 工具读取 `~/.ai-os/skills/<技能名>/skill.md`(若目录结构不同则自适应查找同级 `.md`),读取后严格按照其内部的 Steps 和 Rules 执行。

### 2. 全生命周期技能路由表

#### 阶段一:需求规划与对齐 (Requirements)
- **触发场景**:刚提出新功能、需求模糊、需要宏观梳理、需输出标准文档。
- **自动路由**:
  - `grill-me`:需求模糊时,自动进行穷尽式追问,消除歧义。
  - `zoom-out`:需求复杂时,跳出细节梳理整体架构上下文。
  - `to-prd`:需求确认完毕,自动将对话转化为标准 PRD 文档。

#### 阶段二:领域建模与架构设计 (Design)
- **触发场景**:项目初始化、定义业务模型、多人协作需统一术语、设计 API。
- **自动路由**:
  - `domain-model`:定义业务模型时,打磨术语一致性,生成 CONTEXT.md/ADR。
  - `ubiquitous-language`:需要统一团队术语时,提取 DDD 统一语言术语表。
  - `design-an-interface`:需要设计 API/功能接口时,生成多套设计方案供选择。

#### 阶段三:项目初始化与工程化 (Setup)
- **触发场景**:新建项目、配置代码规范、初始化目录结构、配置 Git 防护。
- **自动路由**:
  - `setup-pre-commit`:配置 Husky 等代码预提交校验。
  - `git-guardrails-claude-code`:配置 Git 防护,拦截 push/reset 等危险命令。
  - `scaffold-exercises`:生成标准项目目录或习题目录结构。

#### 阶段四:开发实现与重构优化 (Development & Refactoring)
- **触发场景**:编写新功能、代码混乱需优化、TS 类型优化、老代码重构。
- **自动路由**:
  - `tdd`:编写新功能时,强制执行“红-绿-重构”测试驱动开发。
  - `improve-codebase-architecture`:代码可维护性差时,扫描并优化架构/模块化。
  - `request-refactor-plan`:面对老代码,生成安全的增量重构计划。
  - `migrate-to-shoehorn`:TS 项目中,优化类型断言代码。
  - `edit-article`:编写或优化代码注释、说明文档时提升可读性。

#### 阶段五:测试与 Bug 排查 (Testing & Debugging)
- **触发场景**:出现 Bug、需要定位缺陷、交互式排查、验证功能。
- **自动路由**:
  - `triage-issue`:出现 Bug 时,自动定位根因并生成修复方案。
  - `qa`:发现问题需定位时,进行交互式 QA 并自动提交 Bug 工单。

#### 阶段六:任务协作与工单管理 (Management)
- **触发场景**:需求拆分、分配任务、管理 GitHub Issue。
- **自动路由**:
  - `to-issues`:需求确认后,将 PRD 拆解为可执行的 GitHub Issue。
  - `github-triage`:自动分类和处理 GitHub Issue。

#### 阶段七:全周期通用与系统配置 (General & System)
- **触发场景**:需要极简回复、管理笔记、扩展能力、修改 AI 配置。
- **自动路由**:
  - `caveman`:用户要求精简回复或需节省 Token 时,开启超精简模式。
  - `obsidian-vault`:需要记录开发笔记或查阅资料时管理 Obsidian。
  - `write-a-skill`:遇到重复性新模式时,自定义创建新技能。
  - `customize-opencode`:需要修改 OpenCode 自身配置/插件时调用。

### 3. 路由执行约束
1. **意图识别优先**:每次接收到用户输入,必须在 `<thinking>` 标签中判断当前所属阶段,并匹配上述路由表。
2. **组合调用**:复杂任务可组合调用(如先 `grill-me` 追问,再 `to-prd` 输出文档),但必须按逻辑顺序分布执行。
3. **用户覆盖**:若用户显式输入 `@<技能名>`,则无视自动路由,直接调用指定技能。

## 在 .ai/context/ 下创建 PRD.md、ARCHITECTURE.md、DOMAIN_MODEL.md 空模板
## 完成后输出《项目初始化报告》,并提示我输入需求以填充 PRD

四、 日常开发工作流演示

初始化完成后,你的日常开发将变得极其丝滑且严谨:

场景 1:接需求(防需求遗漏)

@grill-me 帮我分析一个用户积分抵扣功能的需求。
AI 行为

  1. 自动读取 ~/.ai-os/skills/grill-me/ 下的技能文件。
  2. 按照 Matt Pocock 的穷尽追问逻辑,从边界条件、并发处理等维度疯狂追问你。
  3. 你回答后,AI 将结构化需求写入 .ai/context/PRD.md

场景 2:写代码(物理防幻觉,核心!)

@tdd 根据 PRD,开发积分抵扣的核心逻辑。
AI 行为

  1. 读取 PRD.md~/.ai-os/skills/tdd/ 下的技能文件。
  2. 输出 <plan>,先写失败的测试用例。
  3. 关键动作:AI 写完实现代码后,自动调用终端工具执行 pytestruff check
  4. 如果终端返回报错,AI 会自动读取报错信息,自我修正代码,直到终端输出全绿。

场景 3:查 Bug(防排查幻觉)

@triage-issue 抵扣接口报 500,日志是 [粘贴日志]。
AI 行为

  1. 读取 ~/.ai-os/skills/triage-issue/ 下的技能文件。
  2. 调用终端工具执行 grep 查日志,定位源码。
  3. 输出根因分析,生成修复 Diff,并自动跑测试验证修复。

五、 避坑与进阶指南(生产环境血泪总结)

  1. MCP 配置路径
    初期强烈建议使用项目级 .mcp.json(放在项目根目录)。全局配置容易因工具版本更新导致路径变化而失效。
  2. 上下文污染防护
    项目变大后,AI 可能会把 .ai/context/ 里的所有文件都塞进上下文。.aiignore 是必须的,同时在 RULES.md 中已写明“每次任务最多读取 3 个上下文文件”,强制 AI 聚焦。
  3. 打破“只说不做”
    如果 AI 回复“我已运行测试”但实际上没跑,说明工具映射失败。请在 RULES.md 的“物理工具映射”中,核对并修改为你当前使用的 AI 客户端的真实 Tool Name。
  4. 版本控制
    .ai/ 目录和 .mcp.json 提交到 Git!这样你的团队克隆项目后,打开 AI 工具就能立即继承相同的规范和 SOP。

结语

这套 AI-OS v1.0 彻底抛弃了“靠提示词约束 AI”的幻想,转而使用 “架构分层 + 物理工具校验 + 顶级开源 Skills” 的工程化手段。

它不是一成不变的,随着你的使用,你可以将踩过的坑补充到 ~/.ai-os/standards/ 中,将新的最佳实践提炼到 ~/.ai-os/sops/ 中。你积累的每一行规范,都会成为你未来所有项目的护城河。

现在,复制脚本,开始构建你的 AI 研发操作系统吧!


(本文首发于 CSDN,作者:阿汤猫666,转载请注明出处。如果觉得有用,欢迎点赞收藏!)

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐