熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Jim Fan
NVIDIA 機器人總監和傑出科學家。GEAR 實驗室聯合負責人。解決物理 AGI,一次一個電機。斯坦福大學博士 OpenAI 的第 1 名實習生。
Vibe Minecraft:一個多玩家、自洽、即時的世界模型,允許建造任何東西和召喚任何物體。工具的功能甚至遊戲機制本身都可以通過自然語言編程,例如「時間鎬:將任何方塊恢復到之前的狀態」和「當獨角獸經過時,瀑布變成彩虹橋」。玩家共同定義和操控一個共享的世界。
神經模擬以*多模態*系統提示為輸入:遊戲規則、資產png、全球地圖和復活節彩蛋。它定期將遊戲狀態保存為一系列潛在向量,可以重新加載到上下文中,選項上可以附加「指導文本」以便於編輯。每個玩家都有自己的顯式狀態json(健康、庫存、3D坐標),以及捕捉更高階互動歷史的隱式「玩家向量」。
遊戲管理員可以創建一個Minecraft多元宇宙,因為不同伺服器的潛在向量是兼容的。每個世界可以無縫交叉,幾秒鐘內生成新的世界。人們可以與朋友或自己的過去狀態進行混合與匹配。「稀有向量」可能會出現,因為一些玩家不可避免地會遊蕩到世界模型的奇異、未知潛在空間。那些浮動矩陣可以作為NFT進行交易。你嘗試的越瘋狂,挖掘稀有向量的可能性就越大。
誰先發布Vibe Minecraft,誰就將載入史冊,永遠改變遊戲的進程。

5.98K
我很想看到 FSD 擴展法則,因為它是唯一在行星規模上的物理數據飛輪。模型/數據大小的「突現能力閾值」是什麼?

Elon Musk8月6日 16:02
特斯拉正在訓練一個新的 FSD 模型,參數約為 10 倍,並且在視頻壓縮損失方面有了很大的改進。
如果測試進展順利,可能會在下個月底準備好公眾發布。
71.89K
這是遊戲引擎 2.0。總有一天,UE5 的所有複雜性將被一個數據驅動的注意力權重塊所吸收。這些權重以遊戲控制器命令為輸入,直接動畫化一塊時空像素。
Agrim 和我在史丹佛視覺實驗室時是好朋友和共同作者。看到他在如此酷的研究前沿真是太棒了!恭喜!

Agrim Gupta8月5日 22:14
介紹 Genie 3,我們最先進的世界模型,能夠從文本生成互動世界,實現每秒 24 幀的實時互動,並在 720p 下保持幾分鐘的一致性。🧵👇
9.97K
我觀察到機器人領域中的一個迷你莫拉維克悖論:對人類來說困難的體操,對機器人來說卻容易得多,而像烹飪、清潔和組裝這樣的「不性感」任務卻相對困難。這讓外行人產生了認知失調,「所以,機器人可以做跑酷和霹靂舞,但為什麼牠們不能照顧我的狗呢?」相信我,我的父母問過我這個問題的次數比你想的還要多……
「機器人莫拉維克悖論」也造成了物理AI能力遠比實際更先進的錯覺。我並不是單獨針對Unitree,這適用於行業中所有最近的特技演示。這裡有一個簡單的測試:如果你在側翻機器人面前設置一面牆,它會全力撞上去,造成一場表演。因為它只是過度擬合那個單一的參考動作,對周圍環境毫無意識。
悖論存在的原因是:訓練一個「盲目體操運動員」比訓練一個能看見和操控的機器人要容易得多。前者可以完全在模擬中解決,並且可以零樣本轉移到現實世界,而後者則需要極其真實的渲染、接觸物理和混亂的現實物體動態——這些都無法很好地模擬。
想像一下,你可以不從互聯網訓練LLM,而是從一個純手工製作的文字控制遊戲中訓練。機器人學家們運氣不錯。我們恰好生活在一個加速物理引擎如此出色的世界中,以至於我們可以在幾乎沒有真實數據的情況下實現令人印象深刻的特技。但我們尚未發現通用靈巧性的同樣作弊代碼。
在那之前,我們仍然會被困惑的父母質疑。
351.84K
我的 AGI 酒吧要簡單得多:人工智慧在任何人家為任何美食烹製一頓豐盛的晚餐。物理圖靈測試很可能比諾貝爾獎更難。在未來十年裡,莫拉維克的悖論將繼續困擾著我們,越來越大、越來越黑暗。

Thomas Wolf2025年7月19日
我對AGI的標準是,一個AI能夠因其創造的新理論而獲得諾貝爾獎。
99.26K
我最近在 X 上有點沉默。過去的一年是一次變革性的經歷。Grok-4 和 Kimi K2 很棒,但機器人世界是一個奇妙的狂野西部。感覺就像 2018 年 GPT-1 發佈時的 NLP,還有 BERT 和其他一千朵盛開的花朵。沒有人知道哪一個最終會成為 ChatGPT。辯論很激烈。熵是天價的。想法非常有趣。
我相信機器人技術的 GPT-1 已經在 Arxiv 上的某個地方,但我們不知道到底是哪一個。可以是世界模型、RL、從人類視頻中學習、sim2real、real2sim 等,或它們的任何組合。爭論很激烈。熵是天價的。想法非常有趣,而不是在 AIME 和 GPQA 上擠壓最後幾%。
機器人技術的性質也使設計空間變得非常複雜。與 LLM(文字字串)的乾淨比特世界不同,我們機器人學家必須處理混亂的原子世界。畢竟,迴圈中有一團軟體定義的金屬。法學碩士規範可能很難相信,但到目前為止,機器人學家仍然無法就基準達成一致!不同的機器人有不同的能力範圍——有些更擅長雜技,而另一些則更擅長物體縱。有些用於工業用途,而另一些則用於家務。交叉體現不僅僅是一項研究新奇事物,更是通用機器人大腦的基本特徵。
我與來自不同機器人公司的數十位新老機器人公司的最高管理層進行了交談。有的賣全身。有些人出售身體部位,例如靈巧的手。還有更多人出售鏟子來製造新車身、創建類比或收集大量數據。商業創意空間和研究本身一樣瘋狂。這是一場新的淘金熱,這是自 2022 年 ChatGPT 浪潮以來我們從未見過的。
進入的最佳時間是非共識達到峰值時。我們仍處於損失曲線的起點——有強烈的生命跡象,但距離收斂還很遙遠。每一個漸變的步驟都帶我們進入未知。但我確實知道一件事——沒有觸摸、感受和體現在混亂的世界中,就沒有 AGI。
從更個人的角度來看,運營研究實驗室需要承擔全新的責任。委婉地說,直接向一家 4T 美元的公司的首席執行官提供最新資訊既令人興奮又消耗了我的注意力。我可以掌握並深入瞭解每條人工智慧新聞的日子已經一去不復返了。
我會盡量抽出時間分享更多我的旅程。

877.14K
在未來十年的某一天,我們的每個家庭、每家醫院和每家工廠都會有機器人,以超人的靈巧能力完成每一項枯燥而危險的工作。那一天將被稱為 「星期四」。即使是圖靈也不敢在他最瘋狂的夢想中夢想我們的一生。

signüll2025年4月21日
我們通過了圖靈測試,沒人在乎。沒有遊行。沒有頭版頭條。只。。。漫不經心地聳聳肩。就像“哦,是的,機器現在足夠聰明瞭,可以騙過我們。話說回來,午餐吃什麼?
這種寂靜告訴你關於我們前進的速度的一切。
回到我的 CS 課上,圖靈測試被視為最終 Boss。現在每一次突破都是另一個該死的星期二。
102.16K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可