人形机器人跟人比赛拣包裹

寂静回声 发表于 2026-5-20 11:06:12

近日，美国AI机器人公司Figure AI发起了一场长达10小时的“人机对决”竞赛，结果有些出人意料。
比赛项目很简单，就是由一名人类工人与该公司的人形机器人比拼，看谁在规定时间内能分拣更多包裹。

参赛双方为1名实习生和1个人形机器人团队（3台机器人轮换），比赛中双方需要扫描包裹上的条形码，并将其朝下放置在传送带上。
人类享受加州法定30分钟用餐休息+2个10分钟带薪休息时间，而机器人则无间断自主工作，最终以完成正确分拣的包裹总数为胜负标准。
官方介绍称该机器人使用自研 Helix-02 端侧神经网络系统，此前已展示可连续工作47-57小时的能力，处理超过33000个包裹无故障，平均速度接近人类（约2.6-3秒/件）。
比赛开始前，有人预测机器人势必会获胜，毕竟人类需要休息，而且会疲劳，随着时间推移，后续工作效率和正确率势必会大打折扣。
然而比赛结束时，人类正确分拣了12926个包裹的（平均每2.79秒1个），机器人则为12757个（平均每2.83秒1个），以微弱劣势败北。

Figure AI创始人兼CEO Brett Adcock 表示：“机器人虽未赢，但表现远超预期，这是人形机器人商业化的重要里程碑。”
值得一提的是，此前在直播中，Figure AI还因为一些反常动作遭遇质疑：
有观众指出机器人抓取、转身时存在0.5秒左右滞后，符合人类的操控逻辑，而非AI即时决策；
直播中还出现机器人突然抬手“摸头”、无故停顿等异常动作，被认为是远程操作员调整AR眼镜视角或操作失误的痕迹。

点评
先把官方数据拆解一下，会发现很多有意思的细节：
总工作时间：人类实际工作 9 小时 10 分钟（扣除 30 分钟用餐 + 20 分钟休息），机器人工作 10 小时整
人类效率：12926 件 ÷ 33000 秒 ≈ 2.55 秒 / 件（注意：你看到的 2.79 秒是按 10 小时总时长算的，实际工作效率更高）
机器人效率：12757 件 ÷ 36000 秒 ≈ 2.82 秒 / 件
正确率：双方都没有公布错误率，但官方只统计了 "正确分拣" 的数量，说明机器人可能存在一定的错误分拣或漏扫情况
也就是说，人类在实际工作时间内的效率，比机器人高出约 10%。这还是在人类会疲劳、会走神、会喝水上厕所的情况下取得的成绩。

人类看到 "扫描条形码" 这个规则，会自动理解其最终目的是 "让扫码枪识别条码"，而不是 "把条码调整到某个特定角度"。所以人类会根据包裹的摆放位置、条码的朝向，用最省力、最快的方式完成扫描 —— 可能是手腕转一下，可能是扫码枪歪一下，甚至可能是把包裹翻个面但不调整整体姿态。
而机器人的 Helix-02 神经网络，虽然是端侧运行，但它对规则的理解是字面化、精确化的。它会先识别条码的位置，然后计算出一个 "最优姿态"，再驱动机械臂把条码调整到与扫码枪垂直、距离合适的位置，完成扫描。这个过程中，任何一点偏差都可能导致扫描失败，需要重新调整。
这就是为什么很多工厂里的老工人，看起来动作慢悠悠的，但实际产量比新工人高很多 —— 他们不是在 "执行规则"，而是在 "达成目标"。

人类的熟练动作，是存储在小脑和脊髓中的 "运动程序"，不需要经过大脑皮层的复杂计算。当你拿起一个包裹时，你的手臂、手腕、手指的肌肉会自动调整力度和角度，整个过程的延迟只有几十毫秒。而且这个过程是并行处理的，你的手处理上一个包裹的同时，你的眼睛已经在看下一个包裹。
而机器人的每一个动作，都必须经过 "摄像头采集图像→神经网络识别物体→运动规划算法计算轨迹→驱动电机执行→传感器反馈调整" 这个完整的闭环。即使 Helix-02 的端侧推理速度很快，这个闭环的延迟也在几百毫秒级别。而且机器人的动作是串行处理的 —— 它必须完成上一个动作的所有步骤，才能开始下一个动作。
更重要的是，人类的肌肉记忆是可泛化的。你学会了分拣一种包裹，就能很快学会分拣大小、形状、重量不同的其他包裹。而机器人的 "熟能生巧"，需要大量的训练数据，而且泛化能力很差 —— 如果包裹的材质变了、条码的位置变了、传送带的速度变了，它的效率就会大幅下降。

页: [1]

机械荟萃山庄's Archiver

人形机器人跟人比赛拣包裹