Di recente sono stato un po' silenzioso su X. L'anno scorso è stata un'esperienza di trasformazione. Grok-4 e Kimi K2 sono fantastici, ma il mondo della robotica è un meraviglioso selvaggio west. Sembra la PNL nel 2018 quando GPT-1 è stato pubblicato, insieme a BERT e mille altri fiori che sono sbocciati. Nessuno sapeva chi sarebbe poi diventato ChatGPT. I dibattiti erano accesi. L'entropia era alle stelle. Le idee erano follemente divertenti. Credo che il GPT-1 della robotica sia già da qualche parte su Arxiv, ma non sappiamo esattamente quale. Potrebbero essere modelli di mondo, RL, apprendimento da video umani, sim2real, real2sim, ecc. ecc, o qualsiasi combinazione di essi. I dibattiti sono accesi. L'entropia è alle stelle. Le idee sono follemente divertenti, invece di spremere l'ultima percentuale su AIME e GPQA. La natura della robotica complica notevolmente anche lo spazio di progettazione. A differenza del mondo pulito dei bit per gli LLM (stringhe di testo), noi robotici dobbiamo fare i conti con il mondo disordinato degli atomi. Dopotutto, c'è un pezzo di metallo definito dal software nel circuito. I normies LLM potrebbero trovare difficile da credere, ma finora gli esperti di robotica non riescono ancora a mettersi d'accordo su un punto di riferimento! Robot diversi hanno diversi inviluppi di capacità: alcuni sono più bravi nelle acrobazie mentre altri nella manipolazione degli oggetti. Alcuni sono destinati all'uso industriale, mentre altri sono destinati alle faccende domestiche. La cross-embodiment non è solo una novità della ricerca, ma una caratteristica essenziale per un cervello robotico universale. Ho parlato con dozzine di responsabili di varie aziende di robot, vecchie e nuove. Alcuni vendono tutto il corpo. Alcuni vendono parti del corpo come mani abili. Molti altri vendono le pale per fabbricare nuovi corpi, creare simulazioni o raccogliere enormi quantità di dati. Lo spazio delle idee imprenditoriali è selvaggio quanto la ricerca stessa. È una nuova corsa all'oro, come non si vedeva dall'ondata di ChatGPT del 2022. Il momento migliore per partecipare è quando il picco di non consenso. Siamo ancora all'inizio di una curva di perdita: ci sono forti segnali di vita, ma molto, molto lontani dalla convergenza. Ogni passo di pendenza ci porta verso l'ignoto. Ma una cosa so per certo: non c'è AGI senza toccare, sentire ed essere incarnati in questo mondo disordinato. Su una nota più personale: gestire un laboratorio di ricerca comporta un livello di responsabilità completamente nuovo. Dare aggiornamenti direttamente all'amministratore delegato di un'azienda da 4 trilioni di dollari è, per usare un eufemismo, sia elettrizzante che consuma tutto il mio peso di attenzione. Sono finiti i giorni in cui potevo stare al passo e immergermi in profondità in ogni notizia dell'intelligenza artificiale. Cercherò di ritagliarmi del tempo per condividere di più del mio viaggio.
877,16K