機器人技術的 GPT 時代已經到來
Englishto
直到幾年前,如果你想創辦一家機器人初創公司,光是要讓一條機械臂動起來,就得投入多年的心血,在客製化硬體上花費一大筆錢,並擁有一支彷彿從 NASA 蹦出來的專家團隊。如今,情況已經不一樣了。如今,您可以擁有一台能夠在真正的洗衣房中折衣服的機器人,它可以從其他機器人收集的資料中學習,而驅動它的智慧模型甚至運行在雲端,而不是藏在它背包裡的超級電腦上。我的觀點是:我們正處於機器人技術的「GPT」時代。正如語言模型使人工智慧變得普及一樣,如今機器人技術也正在從精英專業轉變為一項普及、可擴展且能以驚人速度推向市場的技術。現在,您不再需要成為機械工程方面的天才:您需要的是更多的創意、收集資料的能力,以及整合硬體(包括經濟實惠的硬體)的意願,因為智慧是由模型提供的,而不是由金屬提供的。在這場革命背後,有一支看起來像是出自電視劇集的團隊:Physical Intelligence 共同創辦人 Quan Vang,以及 Brian、Chelsea、Sergey、Locky 和 Adnan。他們離開了 Google X,在那裡他們曾從事先進機器人技術專案的研究工作,轉而創辦了一家初創公司,肩負著一項近乎瘋狂的使命:建立一個能夠在任何環境中控制任何機器人、完成任何物理上可行任務的模型。Quan 表示,多年來,折衣服一直是機器人技術的「圖靈測試」:沒有任何傳統演算法能夠應付布料的多樣性、可變形性以及現實世界的隨機性。後來,他們與 Weave(一家由前 Apple 員工創立的新創公司)合作了兩週,成功讓一台機器人真正為真實客戶折疊衣物。另一個案例:物流領域的新創公司 Ultra 現在在真實的倉庫中使用機器人來包裝 Amazon 訂單,這些機器人可以在數小時內幾乎完全自主運作。如果以前每部機器人都像是一座象牙塔,只為自身進行最佳化,那麼現在這些機器人模型是根據來自數十個不同平台的資料進行訓練的。一個具體的數據:OpenX 是一個整合來自多種機器人群的資料的平台,其數據顯示,在執行相同任務時,「通用型」機器人模型的表現比「專業型」機器人模型高出 50%。如果您曾聽說執行這些演算法需要最頂尖的硬體,那就忘了吧:大多數物理智能的示範都是透過雲端中的大腦來執行,而現場的機器人實際上就跟一個智慧網路攝影機差不多。真正的創新就在這裡:問題不再是「如何對每一個動作進行編程」,而是「如何收集正確的資料,並整合一個已經能夠在不同環境中運作的模型」。還有一個沒有人告訴您的重大變化:即使是完全相同的機器人,也會隨著時間而改變,硬體或軟體的微小變化會使收集到的資料變得過時。因此,最好在多種機器人上訓練模型,這樣它們就能學會應對多樣性,並變得更加穩健。而這種多樣性在今天已經轉化為執行「零樣本」任務的能力,也就是說,無需為該任務收集特定資料:去年還需要數百小時的訓練,現在機器人已經能夠進行類化學習。但有一個很少有人考慮的方面:對於機器人新創公司來說,真正的障礙不再是技術,而是如何將機器人整合到真實的工作流程中。Quan 一再強調:我們需要了解機器人真正能夠發揮作用的領域——通常是那些枯燥、重複的任務,容許出現一些錯誤,而且可以從人工監督開始,然後逐步提高自動化程度。初始成本已經降低:硬體更加便宜、開源模型(Physical Intelligence 已發布 PI0 和 PI05,其權重與內部使用的模型相同),而且可以在真實環境中進行測試和改進。我們正處於垂直型新創公司真正的「寒武紀大爆炸」的起點:就像個人電腦在 1980 年代使科技公司數量激增一樣,現在從物流到清潔、從餐飲到照護,每個產業都可以擁有自己的機器人新創公司,這些公司由小型、敏捷的團隊建立,不再需要從零開始重新開發一切。但請注意:挑戰不僅僅是技術方面的,還包括產品和商業方面的挑戰。我們需要了解客戶的真正需求,適應現有的工作流程,並力求快速「盈虧平衡」,也就是說,在擴大規模之前,先透過少數幾台機器人實現經濟上的可持續性。那麼,反向投資者又該如何應對呢?所有人都預期革命將源自家用機器人,但真正的爆發式成長可能會來自那些看不見的工業任務,例如包裝訂單或管理微型物流,因為這些任務允許一定的錯誤空間,而且需求也非常龐大。做好準備:未來的關鍵問題不再是「我可以買哪種機器人」,而是「透過整合一個能夠從所有資料中學習的智慧模型,我可以改進哪些工作流程」。請牢記這句話:機器人技術不再是精密硬體的問題,而是資料、模型和創意整合的問題。如果在聽完這段故事後,您發現自己對機器人新創公司的看法有所改變,可以在 Lara Notes 上使用 I'm In 來表達您的支持——這不是一個「讚」,而是一種接受新觀點並認同這種觀點的姿態。如果明天你要告訴別人為什麼折衣服是機器人技術真正的「圖靈測試」,或者 Ultra 如何徹底改變物流,你可以在 Lara Notes 上使用 Shared Offline 標記在場的人:這樣,這段對話就真正具有意義。本筆記來自 Y Combinator,為您節省了超過一個半小時的聆聽時間。
0shared

機器人技術的 GPT 時代已經到來