琉璃之鸟2026/06/01技术实战2 min read

从苹果皮克斯台灯到开源复刻:具身智能台灯技术全景

#["具身智能"#"嵌入式AI"#"机器人"#"Apple"#"开源硬件"#"HCI"]

引言:一盏灯引发的具身智能革命

Apple ELEGNT 智能台灯机器人

2025 年 2 月,苹果机器学习研究团队在 arXiv 上发布了一篇论文,题为《ELEGNT: Expressive and Functional Movement Design for Non-anthropomorphic Robot》,展示了一款形似皮克斯 Luxo Jr. 的桌面台灯机器人原型。

这款机器人不仅能语音对话、投影信息,还能通过丰富的肢体语言表达情感——它会随着音乐起舞、被拒绝时低头委屈、回答天气前先"看向窗外"。更关键的是,这项研究为非人形机器人的交互设计建立了理论框架,指明了"情感化运动设计"如何大幅提升用户体验。

🎬 演示视频Apple ELEGNT 官方演示 | B 站搬运

Apple ELEGNT 论文:arxiv.org/abs/2501.12493;官方页面:machinelearning.apple.com/research/elegnt

ELEGNT 项目深度拆解

硬件配置

ELEGNT 原型机采用 6-DOF 铰接机械臂(长度约 15cm),头部集成了 LED 灯、摄像头、扬声器和投影仪,辅以激光传感器和麦克风阵列。整个系统通过多个电机控制关节实现灵活运动。

核心创新:表达型 vs 功能型

ELEGNT 框架最核心的贡献在于提出了"表达型运动""功能型运动"的二元对比范式。两组完全相同的硬件执行同样的任务,唯一的差异是运动风格。

询问天气:表达型会先转向窗外"看一眼"再回答;功能型直接回答,无额外动作。

播放音乐:表达型随节奏摇摆、点头;功能型静止不动。

喝水提醒:表达型把杯子轻轻推向用户并点头示意;功能型仅语音提醒。

摄影打光:表达型随用户手部移动流畅跟踪,仿佛在"注视"用户;功能型机械执行指令。

被拒绝同行:表达型垂下头表现失落;功能型无反应。

组装指导:表达型跟随动作调整光照并投影教程;功能型固定位置照明。

表达型 vs 功能型对比

用户研究结果

21 名参与者的对照测试表明,表达型机器人在所有维度上都显著优于功能型:友好度提升约 2 倍,感知智能水平显著更高,交互意愿大幅增强。在社交型任务中,情感连接效果尤为突出。

这套"动物化"的肢体语言借鉴了宠物狗的行为模式——点头、歪头、摇摆、低头——使用户在不自觉中产生情感投射。这也是苹果一贯的产品哲学:技术为人服务,交互体验优先于参数堆砌

商业化时间线

  • 带屏幕 HomePod(J490):2026 年中,无机械臂,7 英寸屏幕
  • 皮克斯台灯桌面机器人(J595):2027 年,机械臂 + 屏幕,售价约 1000 美元
  • AI 安防摄像头(J450):预计 2026 年前后
  • 项目由苹果技术副总裁 Kevin Lynch 领导,Siri 部分由前 Vision Pro 负责人 Mike Rockwell 接手。新 Siri 内部代号 Linwood,机器人将运行全新操作系统 "Charismatic"。

    开源社区复刻方案

    苹果的原型虽然惊艳但毕竟闭源。好消息是,2025-2026 年开源社区涌现了优秀的复刻项目。

    LeLamp:最完整的开源复刻

    LeLamp 由 Human Computer Lab 开发,是全球首个直接基于 Apple ELEGNT 论文的开源实现。

    硬件:5 轴舵机(点头/摇头/转头/俯仰)、树莓派 4 + Pi 摄像头、ReSpeaker 麦克风阵列、WS2812b LED 矩阵。

    软件栈:LiveKit 语音管线、Groq + gpt-oss-120b 推理、LeRobot 运动控制、事件驱动架构。

    关键数据:完全开源(GPL v3.0)、组装时间约 2 小时、320+ 机器人专家参与社区(来自 DeepMind、Google X 等)、50 万美元 Pre-seed 融资。

    核心亮点:完全开源(电路图 + CAD 结构 + 源码),支持可中断的流体动画系统,空闲时台灯自动播放"活着的"细微动作。

  • GitHub: github.com/humancomputerlab/LeLamp
  • SparkLamp:百元级 AI Agent 台灯

    SparkLamp 由硬核高中生与创智教育团队开发,把纯软件 AI Agent(OpenClaw)塞进了物理台灯。

    硬件:聆思 Arcs-Mini、M5Stack CoreS3、4 个高精度串行总线舵机、3D 打印外观。

    AI 核心:OpenClaw AI Agent + 端云协同架构,声纹识别 + 情绪检测,小于 200ms 唤醒反馈。

    关键数据:BOM 成本百元级、完全开源、支持私有模型接入。

  • 在线体验:sparklamp.online
  • 技术架构对比

    两个项目共享类似的软件分层:

  • 感知层:语音识别 (ASR) + 计算机视觉 (CV) + 传感器融合
  • 认知层:大语言模型推理 + 情感计算 + 行为决策
  • 执行层:语音合成 (TTS) + 舵机运动控制 + LED 灯光表达
  • 搭建类似系统:技术路线图

    硬件组件架构图

    如果我们要从零搭建一个具身智能台灯,可以参考以下方案。

    硬件选型

  • 主控:树莓派 4B / Orange Pi 5,预算 300-500 元
  • 舵机:STS3215 串行总线舵机 x 4-6 个,预算 200-400 元
  • 麦克风:ReSpeaker 4-Mic 阵列,预算 150 元
  • 摄像头:Pi Camera V3 / USB 摄像头,预算 100 元
  • LED:WS2812B 环形灯板,预算 30 元
  • 结构件:3D 打印 PLA,预算 50 元
  • BOM 总预算:约 830-1230 元

    软件栈建议

    采用端云协同架构,兼顾响应速度和智能水平:

  • 本地端(树莓派):语音唤醒 (Porcupine)、基础视觉 (OpenCV/MediaPipe)、舵机控制、LED 动画
  • 云端(API 调用):大语言模型推理、复杂语义理解、知识检索
  • 通信层:LiveKit / WebSocket / MQTT
  • 运动控制关键

    借鉴 ELEGNT 框架的运动设计原则:

  • 空闲动画:台灯在无任务时保持微小、缓慢的"呼吸式"运动
  • 关注定向:说话时头部转向用户方向
  • 情感映射:开心时高频小幅摆动,失落时低头慢速下沉
  • 可中断性:任何动画可被新的交互指令中断和替换
  • 总结与展望

    Apple ELEGNT 项目最大的价值不在于其硬件本身,而在于它为"非人形机器的情感表达"设立了设计规范。它告诉我们:机器人不需要长得像人,一盏会点头、会摇摆的台灯,同样能建立情感连接。

    开源社区的反应也令人振奋——LeLamp 和 SparkLamp 证明了这类系统的工程门槛正在快速降低。从 Apple 的研究原型到社区的百元级复刻,只用了不到一年时间。

    我们的项目将基于 LeLamp 的硬件框架 + SparkLamp 的端云协同思路,第一步目标是实现语音对话 + 基础情感化运动 + 灯光跟随三个核心能力。后续再叠加投影教学、多模态感知等高级功能。

    万物皆可有灵,从一盏灯开始。

    参考资料

    >

    - Apple ELEGNT Paper - arXiv:2501.12493
    - LeLamp - GitHub
    - SparkLamp 在线实验室
    - ELEGNT 苹果官方页面
    - Bloomberg: Apple's Tabletop Robot Plans

    // Written with love · 2026/06/01

    评论 (0)

    暂无评论,来说点什么吧

    登录 后发表评论