GPT-5 был запущен вчера. 94,6% на AIME 2025. 74,9% на SWE-bench. По мере того как мы приближаемся к верхним границам этих эталонов, они умирают. Что делает GPT-5 и следующее поколение моделей революционными, так это не их знания. Это умение действовать. Для GPT-5 это происходит на двух уровнях. Во-первых, решение, какую модель использовать. Но во-вторых, и что более важно, через вызов инструментов. Мы живем в эпоху, когда LLM освоили извлечение и переупаковку знаний. Потребительский поиск и кодирование, первоначальные «убийственные» приложения, по сути, являются задачами извлечения знаний. Оба организуют существующую информацию новыми способами. Мы преодолели эти холмы, и в результате конкуренция стала более интенсивной, чем когда-либо. Модели Anthropic, OpenAI и Google сходятся на схожих возможностях. Китайские модели и альтернативы с открытым исходным кодом продолжают приближаться к передовым технологиям. Каждый может извлекать информацию. Каждый может генерировать текст. Новая ось конкуренции? Вызов инструментов. Вызов инструментов трансформирует LLM из советников в исполнителей. Это компенсирует две критические слабости моделей, которые чисто языковые модели не могут преодолеть. Во-первых, оркестрация рабочих процессов. Модели отлично справляются с одноразовыми ответами, но испытывают трудности с многошаговыми, состоящими из нескольких этапов процессами. Инструменты позволяют им управлять длинными рабочими процессами, отслеживая прогресс, обрабатывая ошибки, поддерживая контекст на протяжении десятков операций. Во-вторых, интеграция систем. LLM живут в текстовом мире. Инструменты позволяют им предсказуемо взаимодействовать с внешними системами, такими как базы данных, API и корпоративное программное обеспечение, превращая естественный язык в исполняемые действия. За последний месяц я создал 58 различных инструментов ИИ. Обработчики электронной почты. Интеграторы CRM. Обновления Notion. Ассистенты по исследованиям. Каждый инструмент расширяет возможности модели в новую область. Самая важная способность для ИИ — быстро и правильно выбирать нужный инструмент. Каждое неверное направление убивает весь рабочий процесс. Когда я говорю "прочитай это письмо от Y Combinator и найди все стартапы, которые не находятся в CRM", современные LLM выполняют сложную последовательность. Одна команда на английском языке заменяет целый рабочий процесс. И это всего лишь простой пример. Еще лучше, модель, правильно настроенная с нужными инструментами, может проверить свою собственную работу, что задачи были выполнены вовремя. Этот цикл самопроверки создает надежность в рабочих процессах, которую трудно достичь иначе. Умножьте это на сотни сотрудников. Тысячи рабочих процессов. Увеличение производительности складывается экспоненциально. Победители в будущем мире ИИ будут теми, кто наиболее искусно управляет инструментами и направляет правильные запросы. Каждый раз. Как только эти рабочие процессы станут предсказуемыми, именно тогда мы все станем менеджерами агентов.
3,19K