2026 保姆级教程:0 成本搭建个人 AI API 聚合网关,免费额度统一管理

写在前面

如果你日常用 AI 工具辅助开发——Claude Code、Cursor、ChatBox,或者自己写点调用大模型的小应用——大概率手上散落着好几个平台的免费 API Key:智谱送 2000 万、硅基流动送 2000 万、火山引擎每天送 200 万……

单独用没问题,但切换模型要改代码,多个 Key 管理起来也麻烦。

这篇文章分享一个解决方案:用开源项目 One-API 搭建一个个人 API 聚合网关,把多个厂商的免费额度统一成一个接口,换模型不改代码,还能按需分配额度。

纯技术教程,全程实操,跟着做就行。


一、什么是 API 聚合网关

你的应用 → 聚合网关(统一 OpenAI 格式)→ 智谱/DeepSeek/硅基流动/火山引擎
                       ↓
              统一接口,统一管理

一句话:一个地址,一把 Key,背后挂着好几个厂商的免费额度。所有支持自定义 Base URL 的 AI 工具都能用。


二、选型对比:One-API vs New-API vs LiteLLM

方案 优点 缺点
One-API 20K+ Star,社区最成熟,中文文档全 界面偏朴素
New-API One-API 衍生版,UI 更现代 更新激进,偶尔不稳
LiteLLM 100+ 模型,企业级功能 英文为主,部署复杂

选 One-API:文档全、部署快(一行 Docker)、支持 30+ 厂商渠道类型、GitHub Issue 活跃,踩坑有人答。


三、搭建全流程

3.1 服务器准备

配置项 推荐
厂商 Vultr
区域 新加坡(国内延迟 < 80ms)
规格 1 核 1G / 25GB NVMe
系统 Ubuntu 22.04 LTS
价格 $6/月

按小时计费,随时可销毁。新用户充 $10 送 $10。

域名可选——阿里云或腾讯云搜 .top.asia,首年 ¥1-8。

3.2 部署 One-API

SSH 登录后:

# 安装 Docker
curl -fsSL https://get.docker.com | bash

# 启动 One-API
docker run -d \
  --name one-api \
  --restart always \
  -p 3000:3000 \
  -v /data/one-api:/data \
  justsong/one-api:latest

访问 http://你的IP:3000,默认账号 root / 123456登录后第一件事:改密码

3.3 接入上游渠道


渠道 1:智谱 AI
配置项
注册 open.bigmodel.cn,手机号即开
免费额度 GLM-4-Flash 永久免费 + 新用户送 2000 万 Token
Base URL https://open.bigmodel.cn
渠道类型 type 16(智谱专用),不能用 type 1
模型名 glm-4-flash, glm-4.7-flash

坑:智谱的 OpenAI 兼容路径特殊,type 1 会 404,必须 type 16。


渠道 2:硅基流动
配置项
注册 cloud.siliconflow.cn,手机号即开
免费额度 2000 万 Token(永久有效)
Base URL https://api.siliconflow.cn
渠道类型 type 1
模型名 Qwen/Qwen2.5-7B-Instruct, deepseek-ai/DeepSeek-V3, deepseek-ai/DeepSeek-R1

坑:Base URL 不要写成 https://api.siliconflow.cn/v1。type 1 会自动追加 /v1/chat/completions,多写了会变成 /v1/v1/ → 404。


渠道 3:火山引擎(豆包)
配置项
注册 console.volcengine.com/ark
免费额度 每日 200 万 Token
渠道类型 type 1
模型名 doubao-seed-2-0-lite-260215, doubao-seed-1-6-lite-251015

坑:注册后要去「模型广场」手动开通每个想用的模型,否则 Key 有效但调不通。


渠道 4(可选):百度千帆
配置项
注册 console.bce.baidu.com/qianfan
免费额度 ERNIE-Speed 永久免费 + 各模型送 100 万 Token
模型名 ernie-3.5-8k, ernie-speed-128k

3.4 配置模型倍率

在后台「设置」→ 系统选项中配置。倍率用于计算 Token 消耗:

模型 建议倍率 说明
glm-4-flash 1.0 上游免费,1.0 即可
deepseek-v4-flash 1.5 上游有成本,适当上浮
doubao-seed-2-0-lite 1.0 上游免费

3.5 生成令牌

「令牌」→ 新建,可设额度限制:

  • 个人使用:不限额度
  • 分享给朋友:设 500 万 Token 上限

生成后用法:

from openai import OpenAI

client = OpenAI(
    api_key="你的令牌",
    base_url="https://你的域名/v1"
)

response = client.chat.completions.create(
    model="glm-4-flash",
    messages=[{"role": "user", "content": "你好"}]
)

3.6 绑定域名 + HTTPS

apt install -y nginx certbot python3-certbot-nginx

# Nginx 反向代理配置(略,见附录)
# 将 HTTPS 请求转发到 localhost:3000

certbot --nginx -d 你的域名 --non-interactive --agree-tos --email 你的邮箱

SSL 证书 90 天,certbot 自动续期,不用管。


四、接入 Claude Code / Cursor / ChatBox

4.1 Claude Code

编辑 ~/.claude/settings.json

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://你的域名/v1",
    "ANTHROPIC_AUTH_TOKEN": "你的令牌"
  }
}

4.2 Cursor

Settings → Models → 填入 API Key 和 Base URL。

4.3 ChatBox / NextChat / LangChain

只要支持自定义 Base URL 就兼容,填你的地址和令牌即可。


五、运维要点

# 检查容器状态
docker ps | grep one-api

# 查看日志
docker logs one-api --tail 50

# 备份数据库
cp /data/one-api/one-api.db /backup/one-api-$(date +%Y%m%d).db

部署时加了 --restart always,VPS 重启自动拉起。建议 crontab 加个每日备份。


六、常见问题

Q:免费额度用完了怎么办?
A:用完各平台自动按量计费,单价很低。后台设余额告警即可。

Q:服务器选新加坡还是日本?
A:新加坡,国内延迟最低。

Q:能接入 OpenAI/Claude 官方 API 吗?
A:技术上支持(type 1 填 Key)。注意境外模型需自行评估合规性。

Q:One-API 最低配置?
A:512MB 内存也能跑,关掉 Redis 即可。用户多了再升级。


七、扩展方向

  • 语义缓存:相似问题返回缓存结果,降低延迟和成本
  • 多区域部署:新加坡 + 香港双活
  • 模型路由:简单问题走免费模型,复杂问题自动切高性能模型

有问题欢迎评论区交流。觉得有用点个收藏,后续更新扩展功能。

Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐