AI-API中转站搭建教程

这篇文章提供了一个详细的0成本搭建个人AI API聚合网关的教程，使用开源项目One-API来统一管理多个AI平台的免费API额度。主要内容包括：方案选型：推荐使用One-API作为聚合网关，因其成熟度高、文档齐全且部署简单。部署流程：推荐使用Vultr新加坡服务器通过Docker快速部署One-API 详细配置了智谱AI、硅基流动、火山引擎等多个平台的接入方式使用场景：支持Claud

betatank_johnny

40人浏览 · 2026-05-28 15:28:17

betatank_johnny · 2026-05-28 15:28:17 发布

2026 保姆级教程：0 成本搭建个人 AI API 聚合网关，免费额度统一管理

写在前面

如果你日常用 AI 工具辅助开发——Claude Code、Cursor、ChatBox，或者自己写点调用大模型的小应用——大概率手上散落着好几个平台的免费 API Key：智谱送 2000 万、硅基流动送 2000 万、火山引擎每天送 200 万……

单独用没问题，但切换模型要改代码，多个 Key 管理起来也麻烦。

这篇文章分享一个解决方案：用开源项目 One-API 搭建一个个人 API 聚合网关，把多个厂商的免费额度统一成一个接口，换模型不改代码，还能按需分配额度。

纯技术教程，全程实操，跟着做就行。

一、什么是 API 聚合网关

你的应用 → 聚合网关（统一 OpenAI 格式）→ 智谱/DeepSeek/硅基流动/火山引擎
                       ↓
              统一接口，统一管理

一句话：一个地址，一把 Key，背后挂着好几个厂商的免费额度。所有支持自定义 Base URL 的 AI 工具都能用。

二、选型对比：One-API vs New-API vs LiteLLM

方案	优点	缺点
One-API	20K+ Star，社区最成熟，中文文档全	界面偏朴素
New-API	One-API 衍生版，UI 更现代	更新激进，偶尔不稳
LiteLLM	100+ 模型，企业级功能	英文为主，部署复杂

选 One-API：文档全、部署快（一行 Docker）、支持 30+ 厂商渠道类型、GitHub Issue 活跃，踩坑有人答。

三、搭建全流程

3.1 服务器准备

配置项	推荐
厂商	Vultr
区域	新加坡（国内延迟 < 80ms）
规格	1 核 1G / 25GB NVMe
系统	Ubuntu 22.04 LTS
价格	$6/月

按小时计费，随时可销毁。新用户充 $10 送 $10。

域名可选——阿里云或腾讯云搜 .top、.asia，首年 ¥1-8。

3.2 部署 One-API

SSH 登录后：

# 安装 Docker
curl -fsSL https://get.docker.com | bash

# 启动 One-API
docker run -d \
  --name one-api \
  --restart always \
  -p 3000:3000 \
  -v /data/one-api:/data \
  justsong/one-api:latest

访问 http://你的IP:3000，默认账号 root / 123456。登录后第一件事：改密码。

3.3 接入上游渠道

渠道 1：智谱 AI

配置项	值
注册	open.bigmodel.cn，手机号即开
免费额度	GLM-4-Flash 永久免费 + 新用户送 2000 万 Token
Base URL	`https://open.bigmodel.cn`
渠道类型	type 16（智谱专用），不能用 type 1
模型名	`glm-4-flash`, `glm-4.7-flash`

坑：智谱的 OpenAI 兼容路径特殊，type 1 会 404，必须 type 16。

渠道 2：硅基流动

配置项	值
注册	cloud.siliconflow.cn，手机号即开
免费额度	2000 万 Token（永久有效）
Base URL	`https://api.siliconflow.cn`
渠道类型	type 1
模型名	`Qwen/Qwen2.5-7B-Instruct`, `deepseek-ai/DeepSeek-V3`, `deepseek-ai/DeepSeek-R1`

坑：Base URL 不要写成 https://api.siliconflow.cn/v1。type 1 会自动追加 /v1/chat/completions，多写了会变成 /v1/v1/ → 404。

渠道 3：火山引擎（豆包）

配置项	值
注册	console.volcengine.com/ark
免费额度	每日 200 万 Token
渠道类型	type 1
模型名	`doubao-seed-2-0-lite-260215`, `doubao-seed-1-6-lite-251015`

坑：注册后要去「模型广场」手动开通每个想用的模型，否则 Key 有效但调不通。

渠道 4（可选）：百度千帆

配置项	值
注册	console.bce.baidu.com/qianfan
免费额度	ERNIE-Speed 永久免费 + 各模型送 100 万 Token
模型名	`ernie-3.5-8k`, `ernie-speed-128k`

3.4 配置模型倍率

在后台「设置」→ 系统选项中配置。倍率用于计算 Token 消耗：

模型	建议倍率	说明
`glm-4-flash`	1.0	上游免费，1.0 即可
`deepseek-v4-flash`	1.5	上游有成本，适当上浮
`doubao-seed-2-0-lite`	1.0	上游免费

3.5 生成令牌

「令牌」→ 新建，可设额度限制：

个人使用：不限额度
分享给朋友：设 500 万 Token 上限

生成后用法：

from openai import OpenAI

client = OpenAI(
    api_key="你的令牌",
    base_url="https://你的域名/v1"
)

response = client.chat.completions.create(
    model="glm-4-flash",
    messages=[{"role": "user", "content": "你好"}]
)

3.6 绑定域名 + HTTPS

apt install -y nginx certbot python3-certbot-nginx

# Nginx 反向代理配置（略，见附录）
# 将 HTTPS 请求转发到 localhost:3000

certbot --nginx -d 你的域名 --non-interactive --agree-tos --email 你的邮箱

SSL 证书 90 天，certbot 自动续期，不用管。

四、接入 Claude Code / Cursor / ChatBox

4.1 Claude Code

编辑 ~/.claude/settings.json：

{
  "env": {
    "ANTHROPIC_BASE_URL": "https://你的域名/v1",
    "ANTHROPIC_AUTH_TOKEN": "你的令牌"
  }
}

4.2 Cursor

Settings → Models → 填入 API Key 和 Base URL。

4.3 ChatBox / NextChat / LangChain

只要支持自定义 Base URL 就兼容，填你的地址和令牌即可。

五、运维要点

# 检查容器状态
docker ps | grep one-api

# 查看日志
docker logs one-api --tail 50

# 备份数据库
cp /data/one-api/one-api.db /backup/one-api-$(date +%Y%m%d).db

部署时加了 --restart always，VPS 重启自动拉起。建议 crontab 加个每日备份。

六、常见问题

Q：免费额度用完了怎么办？
A：用完各平台自动按量计费，单价很低。后台设余额告警即可。

Q：服务器选新加坡还是日本？
A：新加坡，国内延迟最低。

Q：能接入 OpenAI/Claude 官方 API 吗？
A：技术上支持（type 1 填 Key）。注意境外模型需自行评估合规性。

Q：One-API 最低配置？
A：512MB 内存也能跑，关掉 Redis 即可。用户多了再升级。

七、扩展方向

语义缓存：相似问题返回缓存结果，降低延迟和成本
多区域部署：新加坡 + 香港双活
模型路由：简单问题走免费模型，复杂问题自动切高性能模型

有问题欢迎评论区交流。觉得有用点个收藏，后续更新扩展功能。

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

TrustKernel 正式推出 PlugMate：一款拇指大小的私人计算机，可将智能手机与电脑升级为具备硬件隔离能力的安全双系统。

openEuler 社区

RISC-V指令集仿真工具：从黄金模型到商业级硬件加速的全景指南

随着RISC-V架构在从物联网到高性能计算领域的快速扩张，指令集仿真工具已成为芯片设计、软件开发与体系结构研究的基石。它们能让工程师在真实硬件流片前，完成从单条指令行为验证到完整操作系统启动的全流程测试。本文将首先聚焦新思科技（Synopsys）——作为RISC-V国际基金会高级会员所提供的企业级仿真解决方案，随后系统梳理其他主流开源与商业工具，并给出选型建议。新思科技并非仅提供孤立的指令集模拟器