Colab 安装运行 Kokoro 中文语音库

xinhuanjieyi

404人浏览 · 2026-05-20 13:03:25

xinhuanjieyi · 2026-05-20 13:03:25 发布

一键安装（直接在免费云服务器Colab Cell 中运行）
python

========== 第1步：安装系统依赖 ==========

!apt-get -qq -y install espeak-ng > /dev/null 2>&1

========== 第2步：安装 Kokoro + 中文支持 ==========

!pip install -q kokoro>=0.9.4 soundfile
!pip install -q “misaki[zh]>=0.8.2”
⚠️ 关键点：misaki[zh] 是 Kokoro 的中文分词器和音素转换器，不装它三丰云就无法处理中文文本！

🎙️ 基础使用：中文语音合成
python
from kokoro import KPipeline
from IPython.display import display, Audio
import soundfile as sf

初始化管道（lang_code=‘z’ 表示中文普通话）

pipeline = KPipeline(lang_code=‘z’)

输入中文文本

text = “你好，欢迎使用 Kokoro 语音合成。这是一款轻量级的开源语音模型，只有8200万参数，却能输出相当自然的中文语音。”

生成语音（选择一个中文音色）

generator = pipeline(text, voice=‘zf_xiaobei’) # 女声-温柔甜美

for i, (gs, ps, audio) in enumerate(generator):
print(f"📌 文本: {gs}“)
print(f"🔤 音素: {ps}”)
display(Audio(data=audio, rate=24000, autoplay=(i==0)))
sf.write(f’output_{i}.wav’, audio, 24000)

print(“✅ 音频已保存为 output_0.wav”)
🗣️ 8种中文音色一览
音色ID 性别风格推荐场景
zf_xiaobei 女声温柔甜美有声书、客服
zf_xiaoni 女声清亮活泼短视频配音
zf_xiaoxiao 女声成熟稳重新闻播报
zf_xiaoyi 女声专业正式教程讲解
zm_yunjian 男声青春活力游戏角色
zm_yunxi 男声温柔细腻有声小说
zm_yunxia 男声成熟稳重企业宣传
zm_yunyang 男声浑厚有力纪录片旁白
python

快速切换不同音色试听

voices = [‘zf_xiaobei’, ‘zf_xiaoni’, ‘zf_xiaoxiao’, ‘zm_yunyang’]
for v in voices:
print(f"\n{‘=’*40}“)
print(f"🎭 正在播放: {v}”)
gen = pipeline(“今天天气真不错，适合出去走走。”, voice=v)
for i, (gs, ps, audio) in enumerate(gen):
display(Audio(data=audio, rate=24000))
break
🔥 进阶功能
1️⃣ 音色混合（创造独特声音）
python

混合两个音色

generator = pipeline(“欢迎来到 Kokoro 的世界！”, voice=‘zf_xiaobei,zm_yunyang’)
for i, (gs, ps, audio) in enumerate(generator):
display(Audio(data=audio, rate=24000))
2️⃣ 调整语速
python
generator = pipeline(“慢慢说，不着急。”, voice=‘zf_xiaobei’, speed=0.8) # 0.8倍速
for i, (gs, ps, audio) in enumerate(generator):
display(Audio(data=audio, rate=24000))
3️⃣ 长文本自动分段
python
text = “”“Kokoro是一款开源语音合成模型，仅有8200万参数，却能输出相当自然的语音。
它支持中文、英语、日语等8种语言，提供超过50种预设音色。
无论是有声书制作、语音助手开发，还是教育内容创作，都是理想的选择。”“”

generator = pipeline(text, voice=‘zf_xiaoxiao’, split_pattern=r’[。！？\n]‘)
for i, (gs, ps, audio) in enumerate(generator):
print(f"段落{i+1}: {gs}")
display(Audio(data=audio, rate=24000))
sf.write(f’segment_{i}.wav’, audio, 24000)
📋 完整可运行代码（复制即用）
python

===== Colab 完整安装 + 运行脚本 =====

1. 安装

!apt-get -qq -y install espeak-ng > /dev/null 2>&1
!pip install -q kokoro>=0.9.4 soundfile
!pip install -q “misaki[zh]>=0.8.2”

2. 运行

from kokoro import KPipeline
from IPython.display import display, Audio
import soundfile as sf

pipeline = KPipeline(lang_code=‘z’) # ‘z’ = 中文
text = “Kokoro，在日语中意为心或精神。这款轻量级语音合成模型，让语音合成变得简单而高效。”

generator = pipeline(text, voice=‘zf_xiaobei’)
for i, (gs, ps, audio) in enumerate(generator):
print(f"文本: {gs}\n音素: {ps}\n")
display(Audio(data=audio, rate=24000))
sf.write(f’kokoro_chinese_{i}.wav’, audio, 24000)

print(“🎉 完成！音频已保存 ✅”)
⚡ 性能参考（Colab T4）
指标数值
显存占用 ~2GB
输出采样率 24kHz
模型大小 ~165MB
推理设备 CPU / GPU 均可
许可协议 Apache 2.0（可商用）
首次运行会自动从 HuggingFace 下载中文模型（~165MB），之后会缓存，无需重复下载。

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

嵌入式开发全栈一览：从硬件到软件的技术全景图

本文系统梳理嵌入式开发的技术体系，涵盖硬件、软件及系统设计全流程。硬件层解析MCU/MPU/SoC核心处理器及关键外设接口，强调电路设计与PCB开发能力；软件层详解C/Rust等编程语言、RTOS/Linux操作系统及调试工具链；开发流程包括需求分析、软硬件协同设计到量产部署，注重实时性、低功耗与安全性设计。文章指出AIoT、边缘计算、RISC-V等前沿趋势，并推荐FreeRTOS、Zephyr等

openEuler 社区

通信与接口协议面试十二、SD卡

1）标准SD卡2.0版本中，工作时钟频率可以达到50Mhz，在SDIO模式下采用4 位数据位宽，理论上可以达到200Mbps（50Mx4bit）的传输速率；在SPI模式下采用1位数据位宽，理论上可以达到 50Mbps 的传输速率。SD卡(Secure Digital Memory Card)是一种基于半导体快闪记忆器的新一代记忆设备。一般用于存储芯片的 BOOT 程序，Linux 操作系统内核，文

openEuler 社区

10分钟了解一下jdk21 的一些新特性

底层原理传统平台线程：1:1 绑定操作系统内核线程，每个线程栈默认 1MB，数量上限几千，线程池需要反复调参（核心线程、队列、拒绝策略）。虚拟线程：JVM 自研 M:N 调度，由载体线程（Carrier Thread）复用 OS 线程；虚拟线程栈极小（几百字节），可轻松创建百万级线程。当虚拟线程发生 IO 阻塞（DB、Redis、HTTP、sleep），会自动卸载、归还载体线程给其他虚拟线程