Colab 安装运行 Kokoro 中文语音库
一键安装(直接在 免费云服务器Colab Cell 中运行)python。
一键安装(直接在 免费云服务器Colab Cell 中运行)
python
========== 第1步:安装系统依赖 ==========
!apt-get -qq -y install espeak-ng > /dev/null 2>&1
========== 第2步:安装 Kokoro + 中文支持 ==========
!pip install -q kokoro>=0.9.4 soundfile
!pip install -q “misaki[zh]>=0.8.2”
⚠️ 关键点:misaki[zh] 是 Kokoro 的中文分词器和音素转换器,不装它三丰云就无法处理中文文本!
🎙️ 基础使用:中文语音合成
python
from kokoro import KPipeline
from IPython.display import display, Audio
import soundfile as sf
初始化管道(lang_code=‘z’ 表示中文普通话)
pipeline = KPipeline(lang_code=‘z’)
输入中文文本
text = “你好,欢迎使用 Kokoro 语音合成。这是一款轻量级的开源语音模型,只有8200万参数,却能输出相当自然的中文语音。”
生成语音(选择一个中文音色)
generator = pipeline(text, voice=‘zf_xiaobei’) # 女声-温柔甜美
for i, (gs, ps, audio) in enumerate(generator):
print(f"📌 文本: {gs}“)
print(f"🔤 音素: {ps}”)
display(Audio(data=audio, rate=24000, autoplay=(i==0)))
sf.write(f’output_{i}.wav’, audio, 24000)
print(“✅ 音频已保存为 output_0.wav”)
🗣️ 8种中文音色一览
音色ID 性别 风格 推荐场景
zf_xiaobei 女声 温柔甜美 有声书、客服
zf_xiaoni 女声 清亮活泼 短视频配音
zf_xiaoxiao 女声 成熟稳重 新闻播报
zf_xiaoyi 女声 专业正式 教程讲解
zm_yunjian 男声 青春活力 游戏角色
zm_yunxi 男声 温柔细腻 有声小说
zm_yunxia 男声 成熟稳重 企业宣传
zm_yunyang 男声 浑厚有力 纪录片旁白
python
快速切换不同音色试听
voices = [‘zf_xiaobei’, ‘zf_xiaoni’, ‘zf_xiaoxiao’, ‘zm_yunyang’]
for v in voices:
print(f"\n{‘=’*40}“)
print(f"🎭 正在播放: {v}”)
gen = pipeline(“今天天气真不错,适合出去走走。”, voice=v)
for i, (gs, ps, audio) in enumerate(gen):
display(Audio(data=audio, rate=24000))
break
🔥 进阶功能
1️⃣ 音色混合(创造独特声音)
python
混合两个音色
generator = pipeline(“欢迎来到 Kokoro 的世界!”, voice=‘zf_xiaobei,zm_yunyang’)
for i, (gs, ps, audio) in enumerate(generator):
display(Audio(data=audio, rate=24000))
2️⃣ 调整语速
python
generator = pipeline(“慢慢说,不着急。”, voice=‘zf_xiaobei’, speed=0.8) # 0.8倍速
for i, (gs, ps, audio) in enumerate(generator):
display(Audio(data=audio, rate=24000))
3️⃣ 长文本自动分段
python
text = “”“Kokoro是一款开源语音合成模型,仅有8200万参数,却能输出相当自然的语音。
它支持中文、英语、日语等8种语言,提供超过50种预设音色。
无论是有声书制作、语音助手开发,还是教育内容创作,都是理想的选择。”“”
generator = pipeline(text, voice=‘zf_xiaoxiao’, split_pattern=r’[。!?\n]‘)
for i, (gs, ps, audio) in enumerate(generator):
print(f"段落{i+1}: {gs}")
display(Audio(data=audio, rate=24000))
sf.write(f’segment_{i}.wav’, audio, 24000)
📋 完整可运行代码(复制即用)
python
===== Colab 完整安装 + 运行脚本 =====
1. 安装
!apt-get -qq -y install espeak-ng > /dev/null 2>&1
!pip install -q kokoro>=0.9.4 soundfile
!pip install -q “misaki[zh]>=0.8.2”
2. 运行
from kokoro import KPipeline
from IPython.display import display, Audio
import soundfile as sf
pipeline = KPipeline(lang_code=‘z’) # ‘z’ = 中文
text = “Kokoro,在日语中意为心或精神。这款轻量级语音合成模型,让语音合成变得简单而高效。”
generator = pipeline(text, voice=‘zf_xiaobei’)
for i, (gs, ps, audio) in enumerate(generator):
print(f"文本: {gs}\n音素: {ps}\n")
display(Audio(data=audio, rate=24000))
sf.write(f’kokoro_chinese_{i}.wav’, audio, 24000)
print(“🎉 完成!音频已保存 ✅”)
⚡ 性能参考(Colab T4)
指标 数值
显存占用 ~2GB
输出采样率 24kHz
模型大小 ~165MB
推理设备 CPU / GPU 均可
许可协议 Apache 2.0(可商用)
首次运行会自动从 HuggingFace 下载中文模型(~165MB),之后会缓存,无需重复下载。
openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构
更多推荐

所有评论(0)