Agora que o GPT-5 foi lançado, como você acha que eu me saí? As minhas previsões para o modelo estavam corretas?
Matt Shumer
Matt Shumer15/04/2024
Minhas previsões para as capacidades do GPT-5: Do menos ao mais interessante: - comprimento de contexto significativamente mais longo + capacidade muito maior de usá-lo efetivamente (ou seja, capacidade de raciocinar através de agulhas em testes de palheiro) - muito mais multimodal (tanto em termos de número de modalidades quanto em quão ‘profundo’ cada uma vai) - saídas multimodais, embora eu adivinharia que algumas modalidades estarão desativadas no lançamento (segurança etc. etc.) - imagine conversar diretamente com o GPT-5, e ele responde, sem usar Whisper ou Voice Engine - avanço no raciocínio Q* - Dois modos: raciocínio + normal — o Q* pode levar um tempo/custo de inferência significativo, então, a menos que haja um avanço em eficiência, eles também podem oferecer um modo de resposta normal como vemos hoje - Da mesma forma, o GPT-5 pode ter uma forma mais avançada de computação adaptativa/uso de Q*... quanto mais difícil a consulta, mais poder ele coloca por trás para fornecer uma ótima solução - capacidades agentivas 10x melhores... agentes simples/restritos estarão quase resolvidos, e nos aproximaremos muito mais de agentes generalistas do mundo real - capacidade de retroceder — além da reflexão, o GPT-5 será capaz de reconhecer erros enquanto responde e corrigir o curso - níveis insanos de coerência em dados de longo prazo... começaremos a pensar menos em usar sistemas separados para habilitar memória e mais em simplesmente incorporar todas as memórias no prompt... isso também impulsionará os agentes para frente - com esses últimos três pontos, você poderá deixar o GPT-5 sozinho e permitir que ele completem tarefas complexas para você, e confiar que ele realmente as faz corretamente sem precisar verificar seu trabalho - treinado em uma quantidade de dados OOM maior do que os modelos anteriores, muitos dos quais foram coletados do ChatGPT, limpos, melhorados, convertidos para outras modalidades, etc. - pós-treinado em dados muito *melhores* do que os modelos líderes atuais - começaremos a ver vislumbres de capacidades muito além do que falamos hoje — por exemplo, terá habilidades mais próximas do utilizável para fazer pesquisa científica O que eu perdi? O que você acha? Responda e me avise.
6,44K