人形机器人跟人比赛拣包裹
近日,美国AI机器人公司Figure AI发起了一场长达10小时的“人机对决”竞赛,结果有些出人意料。比赛项目很简单,就是由一名人类工人与该公司的人形机器人比拼,看谁在规定时间内能分拣更多包裹。
参赛双方为1名实习生和1个人形机器人团队(3台机器人轮换),比赛中双方需要扫描包裹上的条形码,并将其朝下放置在传送带上。
人类享受加州法定30分钟用餐休息+2个10分钟带薪休息时间,而机器人则无间断自主工作,最终以完成正确分拣的包裹总数为胜负标准。
官方介绍称该机器人使用自研 Helix-02 端侧神经网络系统,此前已展示可连续工作47-57小时的能力,处理超过33000个包裹无故障,平均速度接近人类(约2.6-3秒/件)。
比赛开始前,有人预测机器人势必会获胜,毕竟人类需要休息,而且会疲劳,随着时间推移,后续工作效率和正确率势必会大打折扣。
然而比赛结束时,人类正确分拣了12926个包裹的(平均每2.79秒1个),机器人则为12757个(平均每2.83秒1个),以微弱劣势败北。
Figure AI创始人兼CEO Brett Adcock 表示:“机器人虽未赢,但表现远超预期,这是人形机器人商业化的重要里程碑。”
值得一提的是,此前在直播中,Figure AI还因为一些反常动作遭遇质疑:
有观众指出机器人抓取、转身时存在0.5秒左右滞后,符合人类的操控逻辑,而非AI即时决策;
直播中还出现机器人突然抬手“摸头”、无故停顿等异常动作,被认为是远程操作员调整AR眼镜视角或操作失误的痕迹。
点评
先把官方数据拆解一下,会发现很多有意思的细节:
总工作时间:人类实际工作 9 小时 10 分钟(扣除 30 分钟用餐 + 20 分钟休息),机器人工作 10 小时整
人类效率:12926 件 ÷ 33000 秒 ≈ 2.55 秒 / 件(注意:你看到的 2.79 秒是按 10 小时总时长算的,实际工作效率更高)
机器人效率:12757 件 ÷ 36000 秒 ≈ 2.82 秒 / 件
正确率:双方都没有公布错误率,但官方只统计了 "正确分拣" 的数量,说明机器人可能存在一定的错误分拣或漏扫情况
也就是说,人类在实际工作时间内的效率,比机器人高出约 10%。这还是在人类会疲劳、会走神、会喝水上厕所的情况下取得的成绩。
人类看到 "扫描条形码" 这个规则,会自动理解其最终目的是 "让扫码枪识别条码",而不是 "把条码调整到某个特定角度"。所以人类会根据包裹的摆放位置、条码的朝向,用最省力、最快的方式完成扫描 —— 可能是手腕转一下,可能是扫码枪歪一下,甚至可能是把包裹翻个面但不调整整体姿态。
而机器人的 Helix-02 神经网络,虽然是端侧运行,但它对规则的理解是字面化、精确化的。它会先识别条码的位置,然后计算出一个 "最优姿态",再驱动机械臂把条码调整到与扫码枪垂直、距离合适的位置,完成扫描。这个过程中,任何一点偏差都可能导致扫描失败,需要重新调整。
这就是为什么很多工厂里的老工人,看起来动作慢悠悠的,但实际产量比新工人高很多 —— 他们不是在 "执行规则",而是在 "达成目标"。
人类的熟练动作,是存储在小脑和脊髓中的 "运动程序",不需要经过大脑皮层的复杂计算。当你拿起一个包裹时,你的手臂、手腕、手指的肌肉会自动调整力度和角度,整个过程的延迟只有几十毫秒。而且这个过程是并行处理的 ,你的手处理上一个包裹的同时,你的眼睛已经在看下一个包裹。
而机器人的每一个动作,都必须经过 "摄像头采集图像→神经网络识别物体→运动规划算法计算轨迹→驱动电机执行→传感器反馈调整" 这个完整的闭环。即使 Helix-02 的端侧推理速度很快,这个闭环的延迟也在几百毫秒级别。而且机器人的动作是串行处理的 —— 它必须完成上一个动作的所有步骤,才能开始下一个动作。
更重要的是,人类的肌肉记忆是可泛化的。你学会了分拣一种包裹,就能很快学会分拣大小、形状、重量不同的其他包裹。而机器人的 "熟能生巧",需要大量的训练数据,而且泛化能力很差 —— 如果包裹的材质变了、条码的位置变了、传送带的速度变了,它的效率就会大幅下降。
页:
[1]