Ostatnio trochę milczałem na temat X. Miniony rok był doświadczeniem transformacyjnym. Grok-4 i Kimi K2 są niesamowite, ale świat robotyki to cudowny dziki zachód. Czuje się jak NLP w 2018 roku, kiedy opublikowano GPT-1, wraz z i tysiącem innych kwitnących kwiatów. Nikt nie wiedział, który z nich ostatecznie stanie się ChatGPT. Dyskusja była gorąca. Entropia była niebotycznie wysoka. Pomysły były szalenie zabawne. Uważam, że GPT-1 robotyki jest już gdzieś na Arxiv, ale nie wiemy dokładnie, który. Mogą to być modele świata, RL, uczenie się z ludzkiego wideo, sim2real, real2sim itp. itp., lub dowolna ich kombinacja. Debaty są gorące. Entropia jest niebotycznie wysoka. Pomysły są szalenie zabawne, zamiast wyciskać ostatnie kilka % na AIME i GPQA. Charakter robotyki również znacznie komplikuje przestrzeń projektową. W przeciwieństwie do czystego świata bitów dla LLM (ciągów tekstowych), my, robotycy, musimy radzić sobie z niechlujnym światem atomów. W końcu w pętli znajduje się bryła metalu zdefiniowanego programowo. Normatywnym LLM może być trudno w to uwierzyć, ale jak dotąd robotycy nadal nie mogą się zgodzić co do punktu odniesienia! Różne roboty mają różne obwiednie możliwości - niektóre są lepsze w akrobatyce, podczas gdy inne w manipulowaniu obiektami. Niektóre są przeznaczone do użytku przemysłowego, podczas gdy inne do prac domowych. Ucieleśnienie krzyżowe to nie tylko nowinka badawcza, ale także istotna cecha uniwersalnego mózgu robota. Rozmawiałem z dziesiątkami menedżerów najwyższego szczebla z różnych firm zajmujących się robotami, starych i nowych. Niektórzy sprzedają całe ciało. Niektórzy sprzedają części ciała, takie jak zręczne dłonie. Wielu innych sprzedaje łopaty, aby produkować nowe ciała, tworzyć symulacje lub zbierać ogromne ilości danych. Przestrzeń pomysłów na biznes jest równie dzika jak same badania. To nowa gorączka złota, jakiej nie widzieliśmy od fali ChatGPT w 2022 roku. Najlepszym momentem na wejście jest moment, w którym brak konsensusu osiąga szczyt. Wciąż jesteśmy na początku krzywej strat - są silne oznaki życia, ale daleko, bardzo daleko od konwergencji. Każdy gradientowy krok przenosi nas w nieznane. Ale jedno wiem na pewno - nie ma AGI bez dotykania, czucia i wcielania się w ten bałagan w świecie. Z bardziej osobistego punktu widzenia - prowadzenie laboratorium badawczego wiąże się z zupełnie nowym poziomem odpowiedzialności. Przekazywanie aktualnych informacji bezpośrednio dyrektorowi generalnemu firmy o wartości 4 bilionów dolarów jest, delikatnie mówiąc, zarówno ekscytujące, jak i pochłaniające całą moją uwagę. Dawno minęły czasy, kiedy mogłem być na bieżąco i zagłębiać się w każdą wiadomość o sztucznej inteligencji. Postaram się wygospodarować czas, aby podzielić się większą ilością mojej podróży.
877,17K