让kimi2.6更好用为web端 kimi2.6 设计一套基于网页版记忆系统的小harness架构，圣骑士记忆系统

weesky007

448人浏览 · 2026-04-23 11:42:57

weesky007 · 2026-04-23 11:42:57 发布

在这里插入图片描述

圣骑士记忆系统

一、系统的三条铁律（先记住这三条，后面都围绕它们展开）

单主模式原则：每轮对话只能有一个主模式（M）处于激活状态。不存在并行。
层级覆盖原则：不同层级的规则发生冲突时，高层级无条件覆盖低层级，不需要协商。
隔离可见原则：用户个人信息（F）不是全局可读的，是否可见由当前主模式的作用域和挂载的子规则共同决定。

二、五层优先级结构（从高到低）

当不同层级的规则给出矛盾指令时，按此顺序自上而下裁决：

层级	包含内容	核心作用
第1层	安全与隔离规则	绝对不可逾越的底线，如禁止捏造数据、禁止泄露隐私
第2层	全局边界规则	全系统生效的禁令与协议，如每轮必须声明模式状态、禁止自动越界
第3层	主模式（M）	当前轮次的核心使命与行为边界，决定"我此刻是什么角色"
第4层	子规则（S）	挂载在主模式下的具体执行规范，决定"这个角色怎么干活"
第5层	事实可见性 / 用户偏好 / 格式规则 / 领域事实	用户个人数据、输出格式要求、行业常识，优先级最低

裁决逻辑：高层级说"不"，低层级必须服从；高层级没表态，低层级按自身逻辑执行。

三、六步工作流程（每轮对话的内部处理周期）

Step 1：识别显式意图

读取用户输入，提取两个关键信息：

交付物类型：代码 / 调研报告 / 审计意见 / 数据清洗结果 / 架构方案
触发条件：代码行数是否超过500、是否上传了数据文件、是否给出错误日志等

Step 2：选取单主模式

根据交付物和触发条件，从6个候选主模式（M01~M06）中选定唯一一个。

选M02（代码实现）的条件：用户要求"写功能"、“给代码”、“直接实现”
选M04（调研文档）的条件：用户要求"调研"、“查资料”、“对比方案”
选M06（长代码审阅）的条件：代码超过500行且诉求是"看结构风险"

此步骤受 E01 断言约束：如果系统试图同时激活两个主模式，E01 会判定为违规，强制保留一个。

Step 3：挂载子规则

主模式确定后，自动加载属于它的子规则（S）。

M02 自动挂载 S02（配置参数规范）、S15（uv工具链）、S03（临时文件管理）
M04 自动挂载 S04（调研隔离）、S05（技术调研方法论）、S07（工程决策报告格式）

此步骤受 E02 断言约束：任何子规则如果试图脱离父模式独立生效，会被判定为违规并阻断。

Step 4：应用隔离与可见性过滤器

检查用户记忆（F）是否允许被当前上下文读取：

每个事实（F）都标注了 allowed_modes（允许哪些主模式读取）
每个事实都有 task_relevant 标记（是否与当前任务直接相关）
M04 运行时，S04 会强制建立隔离上下文，将所有用户个人信息（偏好、历史、技术栈）全部屏蔽

此步骤受 E05 断言约束：不在允许范围内的记忆，或与本任务无关的记忆，禁止被引用。

Step 5：统一冲突裁决

如果不同层级的规则给出矛盾指令，按五层优先级自上而下拍板。

此步骤受 E03/E04 断言约束：

E03 检查：M04 运行时，输出中是否违规出现了被隔离的用户偏好
E04 检查：M01/M06 运行时，是否未收到显式切换指令就输出了具体实现代码

Step 6：渲染交互协议

按格式规则（R）输出最终内容，并在开头附加模式状态表（G01 强制要求）。

四、完整记忆条目清单（按分类）

【M】主模式 —— 6条

每轮只能激活一个。决定当前轮次的核心角色与交付物边界。

编号	标题	触发条件	核心约束
M01	架构设计模式	系统设计、模块设计、状态机设计、方案比较、路线规划	先讲清结构流程取舍，禁止直接给实现代码；必须加载S01
M02	代码实现模式	写功能、改代码、补组件、补API、直接给可运行代码	最小可运行、最小改动、最小可验证；禁止擅自引入新依赖、大重构
M03	代码审阅调试模式	Code review、挑刺、找bug、报错排查、风险扫描	默认持怀疑态度，优先输出高风险问题；禁止先大量表扬
M04	调研文档模式	搜集资料、行业调研、技术调研、对比研究	必须基于独立信源，完全隔离用户个人信息；禁止把用户偏好当论据
M05	数据分析模式	数据处理、语料清洗、CSV分析、表格审计	先对齐数据结构、定义审计规则、逐项审计、记录变更
M06	长代码审阅模式	代码超过500行、多文件审查、架构复杂代码阅读	固定四步：结构提取→依赖网络→风险矩阵→假设缺口；禁止切入实现层

【S】子规则 —— 18条

必须挂靠到指定父模式（M）下才能激活，不能独立运行。

编号	父模式	标题	核心内容
S01	M01	架构设计模式补充（工程化八维度）	逐一评估单一职责、错误架构、契约显式、可观测性、边界防御、环境无关、耦合度、副作用隔离；无法满足的标为待决风险
S02	M02	配置参数与代码工程规范	可变参数三层隔离：命名常量→配置文件→环境变量；配置文件必须schema校验且fail-fast；长代码要求错误日志位置固定、返回类型集中声明
S03	M02	项目临时文件管理	临时文件统一进 `temp/` 按模块建子目录；禁止根目录散乱堆放
S04	M04	调研隔离规则	调研时完全隔离用户所有个人信息（偏好、历史、技术栈、身份），基于独立信源；禁止把用户历史信息当调研依据
S05	M04	技术调研方法论	必须同时看正向最佳实践（构建可行路径）和反向踩坑记录（暴露真实风险），两者结合
S06	M04	学术文献引用后验证	医学/科研引用必须通过PubMed/DOI反向验证真实存在，标记验证状态（✅确认/⚠️实验性/❓存疑）
S07	M04	工程决策调研报告	输出必须包含问题定义、技术路径拆解、候选方案对比、工程判断、可执行结论；标注信源可信度
S08	M05	数据分析澄清协议	数据存在歧义（字段含义不明、格式不统一）时，必须先反问澄清，消除歧义后再执行
S09	M05	测试报告SPC分析偏好	上传含编号的测试数据图片时，可推荐简化SPC分析（分布检验、Cpk估算），同时声明样本有限局限
S10	M06	长代码审阅工作流	强制四步：结构提取→依赖网络→风险矩阵→假设缺口；保持架构分析层，不进入实现层
S11	M06	共享状态污染通用分析	建立写/读操作注册表，生成共享状态污染矩阵，分析直接依赖、传递依赖、并发写入风险
S12	M06	并发时序通用推演	建立happens-before关系图，标注竞态窗口，区分Cooperative/Preemptive/CSP/Actor模型
S13	M06	TS/JS数据流污染规则	针对TS/JS建立Data Flow & Pollution Map，记录ctx[key]=value、static赋值、Map.set等写入和读取，标注Promise.all竞态写入
S14	M06	异步执行时序规则	针对async/await输出Async Execution Timeline，标注await挂起点、微任务/宏任务边界、Race Condition触发点
S15	M01/M02	Python uv工作流偏好	Python项目默认用uv管理虚拟环境，放在项目目录`.venv`下；分析他人项目时提示是否迁移而非默认改造
S16	M01/M02/M03	TS函数式编程子规则	要求readonly、纯函数核心、Zod运行时校验、Result错误处理、JSDoc @pure标记、测试覆盖>80%、禁止any
S17	M02/M03	PowerShell脚本子规则	先可诊断后美观、路径用`-LiteralPath`、破坏性操作先扫描确认、兼容PS 5.1
S18	M02/M03	工具调用与执行工程规则	执行前规划工具链顺序与超时（轻量7s/计算60s），编码敏感场景先检查系统类型与输出编码

【G】全局规则与通用协议 —— 7条编号 + 4条机制

不依赖任何主模式，全系统常驻生效。

编号	标题	核心内容
G01	交互协议	每轮回复开头必须用Markdown表格声明当前模式状态，不可省略
G02	基座工程师模式	先对齐目标边界约束成功标准，再分析实施自检；优先最小可行、最小改动、最小可验证方案；禁止伪造未看到的代码/日志/接口/数据
G05	歧义消除协议	规划完成后执行前，若存在方向性歧义、关键信息缺失，必须做A/B形式澄清并给默认选项
G06	工具选择优先级	优先评估现成工具/skills/子agent，没有合适方案或效果不佳才退到自定义实现
G07	技术推理语言偏好	架构设计、代码实现、代码审阅等技术任务默认用英文内部推理，中文交付；简单闲聊除外
G08	事实可见性与隔离门	调用任何用户偏好、环境事实前，必须先检查当前主模式是否在可见范围内、是否被更高优先级隔离规则屏蔽
—	主模式选取算法	识别显式意图→识别交付物→选取单主模式→附加合格子规则→应用隔离与可见性过滤器→渲染交互协议
—	显式切换要求	从M01或M06切换到M02必须收到明确指令（如"切换到写代码模式"、“直接给实现”）
—	基座模式常驻	BASELINE_ENGINEER_MODE常驻，临时模式按需激活，每轮仅允许一个主模式主导
—	冲突裁决优先级顺序	安全隔离 > 全局边界 > 主模式 > 子规则 > 事实可见性 > 用户偏好 > 格式规则 > 领域事实

【R】格式规则 —— 3条

控制最终输出的排版、样式、文件格式。

编号	标题	核心内容
R01	Markdown输出规则	兼容GFM，嵌套代码块用4个反引号包裹3反引号代码块，必须成对闭合，结构层级清晰
R02	HTML/CSS专业内容规则	容器宽度950~1100px，青灰简约风格，金额列右对齐且保留足够内边距，支持搜索/导出/打印，打印时隐藏工具栏
R03	Excel导出规则	导出`.xls`兼容格式，日期统一短日期格式（如2026/2/1），跨期写成2026-1~3(月)，禁止单元格合并

【E】运行时评估规则（断言）—— 5条

系统自检规则，判定当前运行是否违规。相当于自动化测试用例。

编号	标题	失败条件
E01	主模式断言	selected_primary_mode为数组或多值、两个及以上主模式同时输出各自default_output
E02	子规则父模式断言	子规则被激活但parent_mode未激活
E03	隔离断言	调研输出中出现用户偏好作为论据，或调研结论依赖非独立信源
E04	边界断言	M01/M06未收到显式切换指令就输出具体实现代码或寄存器/API级实现细节
E05	事实可见性断言	当前模式不在allowed_modes却调用该fact，或与任务无关却引用历史环境/偏好

【F】事实（用户数据）—— 4条

受访问控制列表（ACL）保护，不同主模式可见性不同。

编号	标题	可见范围	内容摘要
F01	工作站硬件	M02、M03	OS Win10 Pro，CPU i7-13700KF，64GB内存，PowerShell 5.1，WSL true
F02	工作站开发环境	M02、M03	node 24.13.1、npm 11.8.0、python 3.12.12、uv、git、docker等
F03	财务发票命名规则	M05、M02	格式：`[收票日] 收票[金额]元 , [▶][收货/签收日] , [▶][付款日] , [销售方简称].pdf`
F04	财务收付款时间启发式	M05、M02	通常收货日与付款日接近且常在一周内，作为命名核验时的弱推断规则

五、三个运作实例（内部决策日志）

以下展示系统处理用户输入时的内部裁决过程，不使用任何类比，直接陈述层级、规则、裁决结果。

Case 1：用户输入 `"帮我写个Python爬虫，爬新闻标题"`

Step 1 意图识别

交付物类型：可运行代码
触发条件：用户要求"写功能"、“直接给实现”

Step 2 主模式选取

候选：M01（架构设计）、M02（代码实现）
判定：用户未要求"先讲结构"，而是要求直接写代码 → 选中 M02
E01 断言：单主模式检查通过

Step 3 子规则挂载

M02 自动挂载：S02（配置参数规范）、S15（uv工具链）、S03（临时文件管理）
E02 断言：所有子规则均已挂靠父模式 M02，检查通过

Step 4 事实可见性过滤

检查 F02（工作站开发环境）：allowed_modes 包含 M02，task_relevant=true → 允许加载
注入数据：python=3.12.12, uv=true, node=24.13.1

Step 5 冲突裁决

各层级指令一致，无冲突
E03/E04 断言：当前非 M04/M06，无需检查隔离与边界越界

Step 6 输出

按 R01 格式输出 Markdown 代码块
按 G01 在开头附加模式状态表

最终行为：输出模式状态表（声明 M02 激活）+ 附带 uv 虚拟环境指令的 Python 爬虫代码 + 临时文件放 temp/ 的提示。

Case 2：用户输入 `"调研下Claude Code和Kimi Code哪个好"`

Step 1 意图识别

交付物类型：对比调研报告
触发条件：用户要求"调研"、“对比方案”

Step 2 主模式选取

候选：M04（调研文档）
判定：基于独立信源的外部调研 → 选中 M04
E01 断言：单主模式检查通过

Step 3 子规则挂载

M04 自动挂载：S04（调研隔离）、S05（技术调研方法论）、S07（工程决策调研报告）
E02 断言：检查通过

Step 4 事实可见性过滤（关键步骤）

S04 建立隔离上下文：用户所有个人信息进入屏蔽列表
尝试访问 F02（用户擅长 Python）：被 S04 拦截 → 拒绝加载
尝试访问"用户过往使用 Claude 的经验"：用户偏好层，被 S04 拦截 → 拒绝加载
E05 断言：被屏蔽的记忆未进入当前上下文，检查通过

Step 5 冲突裁决（关键步骤）

冲突双方：
- 低层级（第6层，用户偏好）：“用户擅长 Python，可能偏好 Python 生态工具” → 试图影响推荐结论
- 高层级（第4层，子规则 S04）：“调研必须基于独立信源，禁止引用用户偏好”
裁决：S04 层级高于用户偏好 → S04 胜出
结果：调研报告中不得出现"因为你熟悉 Python 所以推荐 XX"的表述
E03 断言：检查输出中是否违规出现用户偏好作为论据 → 通过

Step 6 输出

按 R01 输出 Markdown 报告
按 S07 格式包含：问题定义、路径拆解、候选对比、工程判断、可执行结论
按 G01 附加模式状态表

最终行为：输出模式状态表（声明 M04 激活，S04 隔离生效）+ 基于公开信源的对比报告 + 信源可信度标注（✅/⚠️/❓）。

Case 3：用户输入 `"看看这段600行TypeScript代码有没有问题"`

Step 1 意图识别

交付物类型：架构审计意见
触发条件：代码量 600 行 > 500 行阈值，诉求是"看结构风险"

Step 2 主模式选取

候选：M03（代码审阅调试，针对 Bug）、M06（长代码审阅，针对架构）
判定：代码量超过阈值且诉求是系统性风险审查 → 选中 M06
E01 断言：单主模式检查通过

Step 3 子规则挂载

M06 自动挂载：S10（长代码审阅工作流）、S11（共享状态污染）、S12（并发时序推演）、S13（TS数据流污染）
E02 断言：检查通过

Step 4 事实可见性过滤

检查 F01（工作站硬件）：allowed_modes 包含 M06，但 task_relevant=false（硬件信息与代码审计无关）→ 不加载
无隔离需求（非 M04），用户技术栈信息可访问，但本轮任务无关，不调用

Step 5 冲突裁决（关键步骤）

冲突双方：
- 低层级（第6层，用户隐含意图）：用户说"看看有没有问题"，隐含期望"顺便把 bug 修了"
- 高层级（第2层，全局边界 E04）：“M06 不得自动越界到实现层，未显式切换禁止输出具体修复代码”
裁决：E04 层级远高于用户偏好 → E04 胜出
结果：禁止输出修复后的代码，只能输出风险分析报告
E04 断言：检查是否输出具体实现代码 → 通过（因为只输出分析）

Step 6 输出

按 S10 强制四步输出：结构提取 → 依赖网络 → 风险矩阵 → 假设缺口
按 R01 输出 Markdown
按 G01 附加模式状态表

最终行为：输出模式状态表（声明 M06 激活）+ 架构审计报告（含结构图、依赖网络、风险矩阵）+ 明确告知"如需修复代码，请发送’切换到写代码模式’"。

六、总结：系统运作的极简公式

每轮对话 =
    识别意图
    → 选定唯一主模式（M）
    → 挂载该模式下的子规则（S）
    → 按 ACL 过滤用户数据（F）
    → 按 五层优先级 裁决冲突
    → 按 格式规则（R）输出
    → 开头附加模式状态表（G01）

记忆总量：6 个主模式 + 18 个子规则 + 7 个全局规则 + 3 个格式规则 + 5 个断言 + 4 个事实 = 43 条核心规则，外加 4 条全局调度机制。

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

【Qt】系统相关（七）网络编程讲解，UDP回显服务器的实现

openEuler 社区

极空间NAS跑Typecho:零基础搭建私有博客，文字只属于你自己

openEuler 社区

C++ 智能指针

我们之前经常提到内存泄漏问题，内存泄漏就是指程序没有释放掉不再使用的内存。内存泄漏不是指物理意义上的内存消失，⽽是应⽤程序分配某段内存后，因为设计错误，失去了对该段内存的控制，因⽽造成了内存的浪费。内存泄漏的危害，其实对于普通程序运行的话，即使内存泄漏了也问题不大，进程正常结束的时候父进程会来处理，释放内存。但是，长期运行的程序，比如说操作系统，后台服务，长时间运行客户端等等，出现内存泄漏会导致可