В последнее время я немного молчал об X. Прошедший год стал для нас переломным моментом. Грок-4 и Kimi K2 потрясающие, но мир робототехники — это чудесный Дикий Запад. Это похоже на НЛП в 2018 году, когда был опубликован GPT-1 вместе с BERT и тысячей других цветков, которые расцвели. Никто не знал, какой из них в конечном итоге станет ChatGPT. Дебаты были жаркими. Энтропия была заоблачной. Идеи были безумно веселыми. Я полагаю, что GPT-1 робототехники уже находится где-то на Arxiv, но мы не знаем точно, какой именно. Это могут быть модели мира, RL, обучение по человеческому видео, sim2real, real2sim и т.д. и т.., или любая их комбинация. Дебаты идут жарко. Энтропия заоблачна. Идеи безумно веселы, вместо того чтобы выжимать последние несколько % из AIME и GPQA. Природа робототехники также сильно усложняет пространство для проектирования. В отличие от чистого мира битов для LLM (текстовых строк), нам, робототехникам, приходится иметь дело с беспорядочным миром атомов. В конце концов, в контуре есть кусок программно-определяемого металла. Нормальным специалистам со степенью магистра права может быть трудно в это поверить, но до сих пор робототехники все еще не могут прийти к единому мнению о критериях! Разные роботы имеют разные возможности - одни лучше справляются с акробатикой, а другие - с манипуляцией объектами. Некоторые из них предназначены для промышленного использования, в то время как другие – для бытовых задач. Перекрестное воплощение — это не просто научное новшество, а важная функция для универсального мозга робота. Я разговаривал с десятками руководителей высшего звена из различных компаний, занимающихся робототехникой, старых и новых. Некоторые продают все тело. Некоторые продают такие части тела, как ловкие руки. Многие другие продают экскаваторы для изготовления новых корпусов, создания симуляций или сбора огромных массивов данных. Пространство бизнес-идей так же дико, как и само исследование. Это новая золотая лихорадка, подобной которой мы не видели со времен волны ChatGPT 2022 года. Лучшее время для входа — когда пик неконсенсуса. Мы все еще находимся в начале кривой потерь – есть явные признаки жизни, но они очень далеки от конвергенции. Каждый шаг градиента уводит нас в неизвестность. Но одно я знаю точно - не бывает AGI без прикосновения, чувствования и воплощения в беспорядочном мире. Если говорить о более личном плане - управление исследовательской лабораторией сопряжено с совершенно новым уровнем ответственности. Предоставление обновлений непосредственно генеральному директору компании стоимостью 4 триллиона долларов, мягко говоря, одновременно и захватывающее, и всепоглощающее мое внимание. Прошли те времена, когда я мог оставаться в курсе и глубоко погружаться в все новости об искусственном интеллекте. Я постараюсь выкроить время, чтобы рассказать больше о своем путешествии.
877,17K