我最近在 X 上有點沉默。過去的一年是一次變革性的經歷。Grok-4 和 Kimi K2 很棒,但機器人世界是一個奇妙的狂野西部。感覺就像 2018 年 GPT-1 發佈時的 NLP,還有 BERT 和其他一千朵盛開的花朵。沒有人知道哪一個最終會成為 ChatGPT。辯論很激烈。熵是天價的。想法非常有趣。 我相信機器人技術的 GPT-1 已經在 Arxiv 上的某個地方,但我們不知道到底是哪一個。可以是世界模型、RL、從人類視頻中學習、sim2real、real2sim 等,或它們的任何組合。爭論很激烈。熵是天價的。想法非常有趣,而不是在 AIME 和 GPQA 上擠壓最後幾%。 機器人技術的性質也使設計空間變得非常複雜。與 LLM(文字字串)的乾淨比特世界不同,我們機器人學家必須處理混亂的原子世界。畢竟,迴圈中有一團軟體定義的金屬。法學碩士規範可能很難相信,但到目前為止,機器人學家仍然無法就基準達成一致!不同的機器人有不同的能力範圍——有些更擅長雜技,而另一些則更擅長物體縱。有些用於工業用途,而另一些則用於家務。交叉體現不僅僅是一項研究新奇事物,更是通用機器人大腦的基本特徵。 我與來自不同機器人公司的數十位新老機器人公司的最高管理層進行了交談。有的賣全身。有些人出售身體部位,例如靈巧的手。還有更多人出售鏟子來製造新車身、創建類比或收集大量數據。商業創意空間和研究本身一樣瘋狂。這是一場新的淘金熱,這是自 2022 年 ChatGPT 浪潮以來我們從未見過的。 進入的最佳時間是非共識達到峰值時。我們仍處於損失曲線的起點——有強烈的生命跡象,但距離收斂還很遙遠。每一個漸變的步驟都帶我們進入未知。但我確實知道一件事——沒有觸摸、感受和體現在混亂的世界中,就沒有 AGI。 從更個人的角度來看,運營研究實驗室需要承擔全新的責任。委婉地說,直接向一家 4T 美元的公司的首席執行官提供最新資訊既令人興奮又消耗了我的注意力。我可以掌握並深入瞭解每條人工智慧新聞的日子已經一去不復返了。 我會盡量抽出時間分享更多我的旅程。
877.16K