DApp Store | Hub Web3 pour les événements et les jeux

Rubriques tendance

Jim Fan

Directeur de la robotique de NVIDIA et scientifique émérite. Co-responsable du laboratoire GEAR. Résoudre l’IAG physique, un moteur à la fois. Stanford Ph.D. 1er stagiaire d’OpenAI.

J'ai été un peu silencieux sur X récemment. L'année passée a été une expérience transformationnelle. Grok-4 et Kimi K2 sont incroyables, mais le monde de la robotique est un far west merveilleux. On dirait le NLP en 2018 quand GPT-1 a été publié, avec BERT et mille autres fleurs qui ont fleuri. Personne ne savait lequel deviendrait finalement ChatGPT. Les débats étaient animés. L'entropie était à son comble. Les idées étaient incroyablement amusantes. Je crois que le GPT-1 de la robotique est déjà quelque part sur Arxiv, mais nous ne savons pas exactement lequel. Cela pourrait être des modèles du monde, RL, apprentissage à partir de vidéos humaines, sim2real, real2sim, etc. etc., ou toute combinaison de ceux-ci. Les débats sont animés. L'entropie est à son comble. Les idées sont incroyablement amusantes, au lieu de presser les derniers % sur AIME & GPQA. La nature de la robotique complique également grandement l'espace de conception. Contrairement au monde propre des bits pour les LLMs (chaînes de texte), nous, les roboticiens, devons faire face au monde désordonné des atomes. Après tout, il y a un morceau de métal défini par logiciel dans la boucle. Les normies des LLM peuvent avoir du mal à le croire, mais jusqu'à présent, les roboticiens ne peuvent toujours pas s'accorder sur un benchmark ! Différents robots ont des enveloppes de capacité différentes - certains sont meilleurs en acrobaties tandis que d'autres excellent dans la manipulation d'objets. Certains sont destinés à un usage industriel tandis que d'autres sont pour des tâches ménagères. Le cross-embodiment n'est pas juste une nouveauté de recherche, mais une caractéristique essentielle pour un cerveau robotique universel. J'ai parlé à des dizaines de dirigeants de C-suite de diverses entreprises de robots, anciennes et nouvelles. Certains vendent le corps entier. D'autres vendent des pièces du corps comme des mains agiles. Beaucoup d'autres vendent les pelles pour fabriquer de nouveaux corps, créer des simulations ou collecter d'énormes quantités de données. L'espace des idées commerciales est aussi sauvage que la recherche elle-même. C'est une nouvelle ruée vers l'or, comme nous n'en avons pas vu depuis la vague ChatGPT de 2022. Le meilleur moment pour entrer est lorsque les pics de non-consensus. Nous sommes encore au début d'une courbe de perte - il y a de forts signes de vie, mais très, très loin de la convergence. Chaque étape de gradient nous emmène dans l'inconnu. Mais une chose que je sais avec certitude - il n'y a pas d'AGI sans toucher, sentir et être incarné dans le monde désordonné. Sur une note plus personnelle - diriger un laboratoire de recherche s'accompagne d'un tout nouveau niveau de responsabilité. Donner des mises à jour directement au PDG d'une entreprise de 4 trillions de dollars est, pour le dire simplement, à la fois palpitant et totalement absorbant de mes poids d'attention. Fini le temps où je pouvais rester au courant et plonger profondément dans chaque nouvelle sur l'IA. J'essaierai de dégager du temps pour partager davantage de mon parcours.

Meilleurs

Classement

Favoris

Tendance on-chain

Tendance sur X

Récents financements de premier plan

Les plus notables