机器人技术的 GPT 时刻已到来
Englishto
直到几年前,如果您想创办一家机器人初创公司,仅仅为了让一条机械臂能够移动,您就必须投入多年的心血,在定制硬件上花费巨额资金,并拥有一支仿佛来自美国航空航天局(NASA)的专家团队。如今,情况已不再如此。如今,您可以拥有一台在真正的洗衣店里叠衣服的机器人,它能够从其他机器人收集的数据中学习,而驱动它的智能模型甚至运行在云端,而不是藏在它背包里的超级计算机上。观点是这样的:我们正处于机器人技术的“GPT”时刻。正如语言模型使人工智能变得普及一样,现在机器人技术也正在从一种精英行业转变为一种普及、可扩展且能够以惊人速度推向市场的技术。现在,您不再需要成为机械工程领域的天才:您更需要的是创造力、收集数据的能力以及整合硬件(包括经济型硬件)的意愿,因为智能来自于模型,而不是金属。在这场革命的背后,有一支看起来像是从电视剧中走出来的团队:Physical Intelligence 的联合创始人 Quan Vang,以及 Brian、Chelsea、Sergey、Locky 和 Adnan。他们离开了 Google X,在那里他们从事先进机器人项目的工作,然后创办了一家初创企业,其使命近乎疯狂:构建一个能够在任何环境中控制任何机器人、完成任何物理上可行任务的模型。Quan 表示,多年来,叠衣服一直是机器人技术的“图灵测试”:没有任何传统算法能够应对面料的多样性、可变形性以及现实世界的随机性。后来,他们与苹果公司前员工创办的初创公司 Weave 合作了两周,成功地让一台机器人真正为真实客户叠衣服。另一个案例:物流领域的初创企业 Ultra 现在在真实的仓库中使用机器人来打包亚马逊订单,这些机器人可以连续数小时几乎完全自主地工作。如果说以前每个机器人都像是一座象牙塔,只为自身进行优化,那么现在这些机器人模型则是根据来自数十个不同平台的数据进行训练的。一个具体的数据:OpenX 是一个汇总来自多种机器人群的数据的平台,它表明,在相同的任务中,“通用型”机器人模型的表现比“专业型”机器人模型高出 50%。如果您曾经听说过,运行这些算法需要最高级别的硬件,那就忘了吧:大多数物理智能演示的“大脑”都在云端运行,现场的机器人只不过是一个智能网络摄像头而已。真正的创新就在于此:问题不再是“如何对每一个动作进行编程”,而是“如何收集正确的数据并整合一个已经掌握了在不同环境中移动能力的模型”。还有一个没有人告诉您的转折点:即使是完全相同的机器人,也会随着时间的推移而发生变化,硬件或软件上的微小改动也会使收集到的数据变得过时。因此,最好在多种机器人上训练模型,这样它们就能学会应对多样性,并且更加稳健。这种多样性已经转化为执行“零样本”任务的能力,也就是说,无需针对该任务收集特定数据:去年还需要数百小时的训练,而现在机器人已经能够进行类化。不过,有一个方面很少有人考虑到:对于机器人初创企业来说,真正的障碍不再是技术,而是如何将机器人整合到实际工作流程中。Quan 一再强调:我们需要了解机器人在哪些方面能真正发挥作用——通常是在单调、重复的任务中,在这些任务中,一些错误是可以接受的,而且可以从人工监督开始,然后逐步实现自动化。初始成本已经降低:硬件更加经济实惠,开源模型(Physical Intelligence 已发布了 PI0 和 PI05,其权重与内部使用的模型相同),并且可以在真实环境中进行测试和改进。我们正处于垂直初创企业真正的“寒武纪大爆炸”的开端:就像个人电脑在 20 世纪 80 年代使科技公司数量激增一样,现在,从物流到清洁、从餐饮到护理,每个行业都可以拥有自己的机器人初创企业,这些企业由规模小、反应灵活的团队打造,不再需要从零开始重新创造一切。但请注意:挑战不仅在于技术,还在于产品和商业模式。我们需要了解客户的真正需求,适应现有的工作流程,并力求快速“盈亏平衡”,也就是说,在进行规模扩张之前,先通过少量机器人实现经济可持续性。那么,反对者呢?所有人都期待这场革命源于家用机器人,但真正的热潮可能会从那些看不见的工业任务开始——例如包装订单商品或管理微物流——在这些领域,错误的容忍度较高,而需求量巨大。做好准备:明天的关键问题将不再是“我可以购买哪种机器人”,而是“我可以通过整合一个从所有机器人中学习的智能模型来改进哪些工作流程”。需要牢记的一句话:机器人技术不再是复杂硬件的问题,而是数据、模型和创造性集成的问题。如果在听完这个故事后,你意识到自己对机器人初创企业的看法发生了变化,可以在 Lara Notes 上使用“I'm In”来表明这一点——这不是点赞,而是那些接受了新观点并认同这种观点的人所做出的表示。如果明天你要告诉别人为什么叠衣服是机器人技术真正的“图灵测试”,或者 Ultra 如何彻底改变物流,你可以在 Lara Notes 上使用 Shared Offline 来标记在场的人:这样,这段对话才真正具有意义。本笔记来自 Y Combinator,为您节省了超过一个半小时的聆听时间。
0shared

机器人技术的 GPT 时刻已到来