大概在三、四月份的时候,突然涌现了一个 GitHub 仓库,名字叫“同事.skills”。

当时我看到这个之后就觉得特别有意思,我寻思等我之后有时间了可以蒸馏一个自己来玩玩。结果一直拖拖拖。然后一直到五一假期的时候,正好看到了“MIMO百万亿Token补贴”然后我也去试着申请了一下让后给我批了一个月的月度会员。然后我想要蒸馏自己的心思更火热了。于是等到五一回到学校之后,我就正式开始了。

先展示一下成果:

准备阶段:

  • 一台闲置服务器用来当 Agent 的身体
  • 给 Agent 使用的Token
  • 同事.skills(这里我最后选了一个基于同事.skills 迭代后的自己.skills,然后又进行了修改)
  • 你的微信聊天记录,越多越好

因为这个仓库本质上就是一个 skills 所以想要安装的话,你需要先有一个支持  AgentSkills 开放标准的 Agent,像是 Claude Code 和 OpenClaw 这些大部分都可以。

不过这里我选择了一个 GitHub 上一个国人开源的 CowAgent 项目。因为它:

接下来我们需要准备蒸馏时用的聊天记录,如果你 PC 端的聊天记录不够全面的话在 PC 端微信右下角点击聊天记录管理,接下来在同一个 WiFi 下就可以导入手机上保存的聊天记录了。

导出聊天记录我使用的是:点这里查看 ,因为在今年年初的时候我有使用这个工具导出聊天记录生成年度报告,所以在重新导出聊天记录的时候我还是使用的这个工具。

关于聊天记录的选择:从亲密的家人朋友到关系普通的好友都选上一些,同时可以在包含某些群聊的内容,这样的话可以更好的让 AI 通过理解不同亲密程度下你的语言习惯。提取出来的聊天记录可以保存为 html 格式也可以保存成 josn 格式,然后我们可以先在服务器下创建一个文件夹用来保存我们的聊天记录(没有具体目录要求,只要在服务器上就可以了。因为我们可以直接让 Agent 去读取服务器的文件)

环境配置:

我在阿里云上正好还有一个闲置的服务器,是我之前跑 openclaw 用的一个服务器。接下来我把服务器重置成 Linux 系统后就可以先着手配置 CowAgent 所需要的环境了。在项目中明确说明了 Python 版本需在 3.7 ~ 3.13 之间,所以我们先来配置一下服务器的 Python 环境,怎么在 Linux 中配置安装 Python 环境的教程在网上有很多,我就不多描述了。主要流程就是先更新系统然后安装依赖,然后从 Python 官网下载源码解压到服务器中接着编译安装就可以了。安装好之后就是拉取 CowAgent 了,直接通过项目说明中的快速开始指令等待安装完成之后就可以了。接下来我们可以通过“服务器IP + 9899 的端口号”访问 CowAgent 的控制台了。当然,在访问之前你需要确保服务器对 9899 开放,阿里云的服务器可以直接在服务器的控制台找到防火墙然后点击添加规则就可以添加端口号了。

我们会看到这样一个控制台,接下来先要给它接入 API,我们点击配置,可以看到有很多可供选择的模型厂商。

MIMO配置:

MIMO 是最近刚出的所以我们需要选模型厂商为 OpenAI 接着模型选择自定义输入调用模型的名称和 API Key 和 API Base就可以了

DeepSeep配置:

模型厂商选择 DeepSeek 依旧是选择模型这些操作

安装skills:

现在我们的 Agent 已经可以正常聊天了,但是显然还没有蒸馏我们的聊天记录。接下来我们在 CowAgent 的控制台下给他发送这一段指令

安装这个skills,仓库地址为https://github.com/asJEI/yourself-skill.git

这个 skills 不是最开始的同事.skills 而是我基于一个名为自己.skills 魔改出来的新版本。主要侧重点移到了微信解析的聊天记录并且添加了一些对于聊天数据的筛选。最重要的是原本的 skills 经过我的实测虽然确实会按照我的语言习惯回答但是总感觉差点意思,而我修改之后添加了 worldbook.md 的第三层约束,让 Agent 的回复更偏向于“如何按照用户的风格回复”而不是单纯的检索用户口癖进行输出。

在安装完 skills 后继续在聊天框输入 /create-yourself 就可以启动蒸馏程序了

然后我们先把基础信息完善,代号是必填的,剩下两项可以直接跳过让他后续去解析聊天记录就可以了。

我们将之前保存的聊天记录文件夹告诉他,让他自己去读取聊天文件解析就可以了,接着他会根据对你聊天记录的解析生成一个总结和分析,确认无误之后让他继续进行下一步,他就会自动生成关于你的个人画像和各种总结文件,最后启动就可以了

附录:

在控制台点击通道,可以将他接到微信的官方 bot 上。

另外和我聊天真的好没有营养啊

不过不过也是很有意思的。最后再贴一张聊天记录

我的评价是:

免责声明:

本项目用于自我观察与表达建模,不构成心理、医疗、法律或投资建议。
请勿输入你不希望长期保留的敏感数据。

博客链接:数字永生?真的假的!——重生之关于我把自己蒸馏了这一件事 – 主页

本文章使用的 GitHub 仓库如下

自己.skills:asJEI/yourself-skill: 与其蒸馏别人,不如蒸馏自己。欢迎加入数字永生!Inspired by colleague-skill(同事skill)。
聊天记录导出:ycccccccy/echotrace: EchoTrace 是一个本地、安全的微信聊天记录导出、分析与年度报告生成工具 | EchoTrace is a local, secure tool for exporting, analyzing, and generating annual reports of WeChat chat records
CowAgent:zhayujie/CowAgent: CowAgent (chatgpt-on-wechat) 是基于大模型的超级AI助理,能主动思考和任务规划、访问操作系统和外部资源、创造和执行Skills、通过长期记忆和知识库不断成长,比OpenClaw更轻量和便捷。同时支持微信、飞书、钉钉、企微、QQ、公众号、网页等接入,可选择DeepSeek/OpenAI/Claude/Gemini/ MiniMax/Qwen/GLM/LinkAI,能处理文本、语音、图片和文件,可快速搭建个人AI助理和企业数字员工。

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐