低成本搭建家庭 AI 服务器：树莓派 + Ollama 完整教程

冷夜琛

174人浏览 · 2026-06-12 10:42:14

冷夜琛 · 2026-06-12 10:42:14 发布

📝 树莓派部署 Ollama + 跨平台调用完整总结

🎯 最终成果

项目	状态
树莓派系统	64位 (aarch64)
可用空间	3.1GB
已安装模型	qwen2.5:1.5b（约1GB）
Ollama 服务	✅ 运行中，监听 0.0.0.0:11434
Windows 调用	✅ 可连接使用

📋 完整部署步骤回顾

第一阶段：环境准备

确认系统架构
```
uname -m   # 必须是 aarch64
```

清理空间（删除 Wolfram + Scratch，释放 ~4.7GB）

sudo rm -rf /opt/Wolfram
sudo rm -rf "/opt/Scratch 3"

注意：要保证树莓派上的SD卡的空间充足，空间不够可以清理系统烧录中所带来的一些用不上的组件或者库。
3. 查看空间

df -h /

在这里插入图片描述

第二阶段：安装 Ollama

下载 Ollama 二进制文件

sudo wget -O /usr/local/bin/ollama https://ollama.com/download/ollama-linux-arm64
sudo chmod +x /usr/local/bin/ollama

验证安装
```
ollama --version
```

第三阶段：启动服务并开放局域网访问

启动 Ollama 服务（监听所有接口）

OLLAMA_HOST=0.0.0.0:11434 /usr/local/bin/ollama serve &

在这里插入图片描述

验证服务状态

sudo netstat -tlnp | grep 11434   # 应显示 0.0.0.0:11434
curl http://localhost:11434/api/tags

第四阶段：下载模型

下载中文模型
```
ollama run qwen2.5:1.5b
```

第五阶段：Windows 跨平台调用

获取树莓派 IP
```
hostname -I   # 例如 192.168.3.217
```

Windows 测试连接

curl http://192.168.3.217:11434/api/tags
```![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6ee18224c2cc42c4a96310a06ca558c7.png)

注意：测试连接的是要保证ollama在树莓派是运行状态中，运行命令如下：

sudo OLLAMA_HOST=0.0.0.0:11434 /usr/local/bin/ollama serve &

Python 调用代码

import requests

OLLAMA_URL = "http://192.168.3.217:11434/api/generate"

def chat(prompt):
    response = requests.post(
        OLLAMA_URL,
        json={"model": "qwen2.5:1.5b", "prompt": prompt, "stream": False}
    )
    return response.json()["response"]

print(chat("你好,你是谁，一句话概括。"))

在这里插入图片描述

⚠️ 踩过的坑及解决方法

问题	原因	解决方法
空间不足	Wolfram + Scratch 占 4.7GB	删除这两个软件
解压太慢	SD 卡随机写入慢	改用直接下载二进制文件（50MB）
`ollama: command not found`	未复制到 `/usr/local/bin`	`sudo cp ~/bin/ollama /usr/local/bin/`
systemd 启动失败 (status=217/USER)	服务配置问题	改用 `nohup` 或直接命令行启动
Windows 无法连接	Ollama 只监听 127.0.0.1	设置 `OLLAMA_HOST=0.0.0.0:11434`
连接后 `{"models":[]}`	用 sudo 启动，读取了 root 的配置	去掉 sudo，用 pi 用户启动

🚀 常用命令速查

用途	命令
启动服务	`OLLAMA_HOST=0.0.0.0:11434 /usr/local/bin/ollama serve &`
查看服务状态	`sudo netstat -tlnp \| grep 11434`
查看已安装模型	`ollama list`
运行模型	`ollama run qwen2.5:1.5b`
删除模型	`ollama rm 模型名`
查看空间	`df -h /`
查看树莓派 IP	`hostname -I`

📊 性能说明

模型	速度	适用场景
qwen2.5:1.5b	较慢（3-5 tokens/秒）	中文对话、一般问答
tinyllama	较快	快速响应、轻量任务
gemma3:1b	中等	英文对话、平衡选择

树莓派 CPU 推理就是慢的，这是正常现象。 如需更快速度，建议：

换更小的模型（tinyllama）
外接 USB SSD 启动
或直接用电脑跑

✅ 最终验证

# 树莓派上
curl http://localhost:11434/api/tags

# Windows 上
curl http://192.168.3.217:11434/api/tags

两者都应返回包含 qwen2.5:1.5b 的 JSON。

部署完成！ 🎉

openEuler 社区

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目，面向数字基础设施四大核心场景（服务器、云计算、边缘计算、嵌入式），全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐

电脑效率翻倍：新手必学的实用操作指南

很多人每天在电脑前花费数小时，却往往忽略了操作系统本身其实藏着一套高效的“组合拳”。我们习惯了安装各种第三方工具来解决问题：用软件整理文件、用插件管理剪贴板、甚至专门下载程序来清理磁盘。但实际上，现代操作系统经过多年迭代，已经内置了大量能够显著提升效率的原生功能。这些功能不仅稳定可靠，无需额外占用系统资源，而且一旦掌握，就能让日常操作如行云流水般顺畅。你是否经历过这样的场景：面对几百个命名混乱的照