QooBot:全栈开源的仿生人操作系统——软硬一体,自由制造

摘要:QooBot 是一个面向仿生人的开源全栈生态,涵盖从机械图纸、电路设计到操作系统、AI 算法的完整技术栈。本文从架构全景、大脑核心、推理引擎、开发者生态等维度全面解读这个机器人领域的"Android + 开源硬件"项目。


一、项目概述

QooBot(酷博)是一个软硬一体、全栈开源的仿生人操作系统项目。它的使命是为机器人领域做开源操作系统为计算领域所做的事:降低门槛、加速创新、构建全球社区

项目采用 Apache 2.0 协议,从芯片到云端、从机械图纸到 AI 算法,全部开源。任何人都可以基于 QooBot 构建自己的仿生人。

核心数据

指标 数值
总功能模块 500+
源代码文件 ~540 个
测试用例 350 个(全部通过)
当前版本 v1.0.0-alpha
技术栈 C++17 / Python 3.11 / TypeScript / Java
开源协议 Apache 2.0

二、架构全景:七大平台统一架构

QooBot 按运行平台分为 7 个平台目录,构成完整的仿生人软硬件生态:

QooBot 全栈生态
├── 🤖 qoobot-os        仿生人操作系统(运行在机器人硬件内)
│   ├── brain/          大脑核心(感知/认知/决策/运动规划)
│   ├── hal/            硬件抽象层(传感器/执行器/计算平台)
│   ├── ai-engine/      AI 推理引擎(NPU/GPU/DSP 多后端加速)
│   ├── services/       系统服务(语音/导航/空间理解/多机协同)
│   ├── edge/           边缘模块(推理卸载/数据同步)
│   └── store/          技能商店端侧运行时
├── ☁️ qoobot-service   云端微服务(认证/推理/设备管理/OTA/技能市场)
├── 🌐 qoobot-web       浏览器 Web 应用(管理后台/社区/可视化/远程操控)
├── 🖥️ qoobot-desktop   桌面软件(开发者工具链/远程监控控制台)
├── 📱 qoobot-mobile    移动 App(规划中)
├── 🔌 qoobot-proto     跨平台 gRPC/Protobuf 协议定义
└── 🔗 qoobot-chain     供应链制造标准

与国内外主流厂商的对比

维度 QooBot Boston Dynamics Tesla Optimus Figure AI 宇树机器人 小鹏机器人
软件策略 🟢 完全开源 🔴 完全封闭 🔴 完全封闭 🔴 封闭商业 🟡 部分开源 🔴 封闭商业
硬件图纸 🟢 全开源 🔴 不公开 🔴 不公开 🔴 不公开 🔴 不公开 🔴 不公开
操作系统 自研 qoobrain 自研内部 OS FSD+Dojo Helix 模型 Linux+ROS 自研 XBrain
开发者生态 🟢 IDE/仿真/技能市场 🔴 仅内部 🔴 仅内部 🔴 仅内部 🟡 SDK/API 🔴 仅内部
技能市场 🟢 qoostore

QooBot 是行业内唯一同时实现软件全开源 + 硬件图纸全开源的项目,堪称机器人领域的"Android + 开源硬件"结合体。


三、大脑核心(qoobrain):仿生人的认知引擎

大脑模块是整个仿生人系统的核心,承担感知、认知、决策、运动规划与实时控制等关键职能。

3.1 五级降级推理架构

Brain OS 实现了业界领先的五级降级推理架构,通过 RuntimeFactory 工厂模式自动选择最优后端:

优先级 1: TensorRT-LLM     → Jetson Orin GPU  → Qwen2.5-7B INT4 (4.2GB)
优先级 2: vLLM             → x86 服务器 GPU   → Qwen2.5-7B
优先级 3: llama.cpp        → CPU 兜底         → Qwen2.5-1.5B GGUF (0.99GB)
优先级 4: DeepSeek-V3 Cloud → 云端 API        → 始终可用
优先级 5: ONNX Runtime     → CV 模型专用      → YOLO/SAM 等

设计哲学:端侧主推理保证低延迟,云端大模型作为兜底,确保机器人永远能思考

3.2 认知流水线:从自然语言到动作执行

BrainAgent 是认知引擎的顶层编排器,核心流水线为:

自然语言指令 → 意图解析 → 任务分解 → 行为树生成 → 轨迹规划 → 执行
     ↓              ↓          ↓           ↓
 "把红色杯子      LLM解析   子任务DAG   BehaviorTree   TRAC-IK+
  放到桌子右侧"   +规则双路   分解      .CPP XML生成   STOMP

五步流水线详解

  1. 意图解析:LLM (Qwen2.5-7B) + 规则双路解析,将自然语言转换为结构化意图 {action, target, constraints, confidence}
  2. 任务分解:LLM + 模板双路分解,生成子任务 DAG 树(如 navigate_to → detect → pick → place
  3. 行为树生成:将子任务列表转换为 BehaviorTree.CPP v4 XML 格式
  4. Function Calling:通过 FunctionCallParser 解析 LLM 输出的结构化 JSON,支持三种容错提取策略
  5. Prompt 工程:使用 Jinja2 模板引擎,包含 5 个专业模板(意图识别、任务分解、行为树生成、场景理解、常识推理)

3.3 人在回路(Human-in-the-Loop)

机器人在执行关键任务时提供 5 种轨迹策略供人类选择:

策略 说明
OPTIMAL 最优轨迹(默认,超时自动执行)
CONSERVATIVE 保守策略(最大安全裕度)
AGGRESSIVE 激进策略(最小时间代价)
EXPLORATORY 探索策略(尝试新路径)
ADVERSARIAL 对抗策略(最坏情况模拟)

3 秒倒计时机制,超时自动执行最优策略,兼顾安全与效率。

3.4 多模态模型矩阵

大脑集成了覆盖感知全链路的模型矩阵:

模型 参数量 量化 大小 推理目标 用途
Qwen2.5-7B-Instruct 7B INT4 4.2 GB <200ms 主推理引擎
Qwen2.5-3B-Instruct 3B INT4 1.8 GB <150ms 降级备选
Qwen2.5-1.5B-Instruct 1.5B GGUF Q4 0.99 GB <500ms CPU 兜底
YOLOv11 Nano ONNX 10.5 MB <33ms (30FPS) 实时目标检测
SAM 2 Hiera Tiny ONNX 70 MB <50ms 实例分割
Whisper Large V3 CTranslate2 1.5 GB RTF 0.05 语音识别

四、AI 推理引擎(QooCore):芯片级加速

QooCore 是 C++17 实现的端侧 AI 推理引擎,对标 NVIDIA Jetson 软件栈与 Qualcomm AI Engine。

四层架构

Layer 4  应用层    qoobrain(感知)/ qoocloud(混合推理)/ CLI/SDK
Layer 3  运行时层  统一推理引擎 → 实时调度器 → 异构后端抽象
Layer 2  编译层    模型导入 → 图优化 → 量化编译 → 模型剪枝
Layer 1  基础设施层 内存管理 · 专用算子库 · 硬件适配 · 观测诊断

核心特性

特性 说明
多后端统一抽象 一套 API 同时支持 NPU/GPU/DSP/CPU
零拷贝流水线 ION/DMA-BUF 跨硬件内存共享,相机→NPU→GPU 无 memcpy
编译工具链 ONNX → IR → 优化 → 量化 → .qoomodel
亚毫秒级延迟 YOLO < 10ms (NPU INT8),VLA < 100ms
多模型并发 检测 + 分割 + 规划并发,> 30 fps
插件化 HAL 新芯片只需实现 NpuHal 接口

支持芯片矩阵

厂商 芯片 后端
Qualcomm Snapdragon 8 Gen 3 QNN
Horizon Journey 5/6 BPU
Rockchip RK3588 RKNN
NVIDIA Jetson Orin CUDA
ARM Cortex-A78AE Neon

五、硬件抽象层(HAL):跨平台跨本体

HAL 是纯 C 语言接口层,定义了 qoobrain 与硬件之间的所有标准化接口。9 个头文件覆盖仿生人硬件全貌:

头文件 职责
qoo_hal.h 主入口,系统初始化/启动/停止/版本
qoo_hal_types.h 基础类型(位姿、向量、时间戳)
qoo_hal_sensor.h 传感器抽象:RGB-D 相机、LiDAR、IMU(6/9 轴)、麦克风阵列、触觉传感器
qoo_hal_actuator.h 执行器抽象:关节电机(7 种控制模式)、末端执行器(平行夹爪/三指/吸盘/灵巧手)
qoo_hal_power.h 电源管理
qoo_hal_safety.h 安全接口(4 级安全状态机)
qoo_hal_comm.h 通信总线(CAN/EtherCAT)
qoo_hal_time.h 时间同步
qoo_hal_error.h 错误码定义

7 种电机控制模式:IDLE / POSITION / VELOCITY / TORQUE / IMPEDANCE / ADMITTANCE / CYCLIC_SYNC


六、安全体系:硬件级安全保障

安全是仿生人的生命线,QooBot 实现了硬件级安全架构

安全机制 指标
安全监控频率 1000 Hz
急停响应时间 < 5ms
碰撞检测 FCL 碰撞检测库
安全状态机 4 级(正常/预警/降级/急停)
合规标准 ISO 10218 / ISO 13482

七、开发者生态:类 iPhone 的工具链体系

QooBot 提供对标 Apple 开发者生态的完整工具链:

QooBot 工具 对标 功能
qoodev Xcode CLI 工具、LSP Server、VS Code 插件、Python/C++ SDK
仿真桥接 Simulator MuJoCo + Isaac Sim 深度集成
数据标注 CreateML 2D/3D 标注、轨迹标注、RLHF 偏好标注
qooremote 远程桌面 多路视频回传、遥操作控制、3D 数字孪生
brain-viz Instruments Next.js + Three.js 3D 传感器数据实时渲染
qoostore App Store 技能发布、订单支付、CDN 分发

qoodev CLI 工具(v1.7.0)

18 个工具子模块全部完成:

qoo init        # 初始化项目
qoo build       # 编译技能
qoo run         # 运行仿真
qoo test        # 运行测试
qoo package     # 打包技能 (.qooskills + 签名)
qoo debug       # 远程调试(Python/C++ 混合)
qoo profile     # 性能剖析(延迟/火焰图/功耗)
qoo record      # 示教录制(.qoodata 二进制格式)
qoo annotate    # 数据标注(2D/3D/轨迹)
qoo compile     # 模型编译(qoocore 集成)

技能开发示例

from qoobot_brain import Skill, Perception, Action

class PickAndPlace(Skill):
    """一个简单的抓取放置技能"""

    def setup(self):
        self.perception = Perception(cameras=["front_rgbd"])
        self.action = Action(controller="arm_6dof")

    async def run(self, target: str):
        obj = await self.perception.detect(target)
        grasp = await self.action.plan_grasp(obj)
        await self.action.execute(grasp)

八、VLA 端到端:视觉-语言-动作前沿探索

VLA(Vision-Language-Action)Agent 是实现端到端"看→想→动"的实验性模块,当前为 Phase3 阶段。

技术参数

参数 数值
基座模型 Qwen/Qwen2-VL-7B-Instruct
视觉编码器 SigLIP + DINOv2
动作空间 7-DoF 绝对位姿 (x, y, z, roll, pitch, yaw, gripper)
预测视界 16 步 @ 10Hz(1.6 秒前瞻)
LoRA 配置 rank=64, alpha=128, dropout=0.05
LoRA 模型大小 56 MB

VLA 中文改造路线图

OpenVLA-7B (原始)
    │
    ├── Step 1: 中文指令微调(LoRA 微调)
    ├── Step 2: 跨本体适配(仿生人/机械臂/移动底盘)
    ├── Step 3: 动作 Chunk 预测(参考 π₀ 的 action chunking)
    └── Step 4: 推理加速(INT4/INT8 → TensorRT-LLM,目标 < 100ms)

九、云端协同:端云一体智能栈

云端微服务基于 Java Spring Boot 微服务架构,7 大微服务全部完成:

微服务 功能 功能数
auth 统一身份认证、OAuth、API Key、设备信任 59
cloud 远程推理、设备管理、OTA 升级、数字孪生 45
compliance AI 伦理、安全标准、隐私法规、出口管制 42
store 技能商店:发布、支付、评论、CDN 分发 45
chain 供应链制造:生产、标定、质检、BOM 管理 36
gear 配件认证:MFQ 认证流程、实验室管理 36
community 全球社区:论坛、学院、活动、贡献者网络 38

十、项目路线图

当前阶段(v1.0 — 全部子项目设计完成)

  • ✅ 仿生人操作系统核心(brain Alpha)
  • ✅ 端侧 AI 推理引擎(ai-engine v0.5)
  • ✅ 硬件参考设计(hal,含青龙硬件参考设计)
  • ✅ 统一身份基础设施(auth v0.6)
  • ✅ 开发者工具链(qoodev v1.7.0,18 个 CLI 子模块)
  • ✅ 系统服务(9 大服务全部完成)
  • ✅ 云端服务(7 大微服务全部完成)
  • ✅ 技能市场(qoostore)
  • ✅ 远程操控面板(WebRTC + 3D 数字孪生)
  • ✅ 开源社区门户

下一阶段(v1.1+ — 真机验证)

  • ⬜ brain 在 ≥ 3 个平台上完成真机部署
  • ⬜ 仿真环境(Isaac Sim + MuJoCo)深度完善
  • ⬜ Skill SDK v1.0 及开发者文档
  • ⬜ 端侧推理编译器性能基准测试

十一、总结

QooBot 是目前开源社区中最完整的仿生人全栈方案,核心特点可以概括为:

  1. 全栈开源:从机械图纸到 AI 算法,Apache 2.0 协议,无任何闭源组件
  2. 端云协同:端侧 Qwen2.5-7B 主推理 + 云端 DeepSeek-V3 兜底,五级降级架构
  3. 芯片级加速:支持 5 家芯片厂商,零拷贝流水线,亚毫秒级推理延迟
  4. 开发者友好:对标 Xcode 的完整工具链,18 个 CLI 模块,VS Code 插件
  5. 安全第一:1000Hz 监控频率,<5ms 急停响应,4 级安全状态机
  6. 生态完善:技能市场 + 配件认证 + 供应链制造 + 全球社区

项目地址https://github.com/qoobots/qoobot

如果这个项目对你有帮助,欢迎 Star ⭐ 和 Fork,一起推动仿生人开源生态的发展!


Logo

openEuler 是由开放原子开源基金会孵化的全场景开源操作系统项目,面向数字基础设施四大核心场景(服务器、云计算、边缘计算、嵌入式),全面支持 ARM、x86、RISC-V、loongArch、PowerPC、SW-64 等多样性计算架构

更多推荐