Ahora que GPT-5 ha salido, ¿cómo crees que lo hice? ¿Fueron correctas mis predicciones para el modelo?
Matt Shumer
Matt Shumer15 abr 2024
Mis predicciones sobre las capacidades de GPT-5: De menos a más interesante: - longitud de contexto significativamente más larga + mucha mayor capacidad para usarla de manera efectiva (es decir, capacidad para razonar a través de agujas dentro de pruebas de paja) - mucho más multimodal (tanto en términos de # de modalidades como de cuán ‘profunda’ es cada una) - salidas multimodales, aunque supongo que algunas modalidades estarán deshabilitadas en el lanzamiento (seguridad, etc. etc.) - imagina hablar directamente con GPT-5, y que te responda, sin usar Whisper o Voice Engine - avance en el razonamiento Q* - Dos modos: razonamiento + normal — Q* puede requerir un tiempo/costo de inferencia significativo, así que a menos que haya un avance en eficiencia, también pueden ofrecer un modo de respuesta normal como el que vemos hoy - De manera similar, GPT-5 puede tener una forma más avanzada de uso adaptativo de computación/Q*... cuanto más difícil sea la consulta, más potencia le asignará para proporcionar una gran solución - capacidades agenticas 10 veces mejores... los agentes simples/restringidos estarán mayormente resueltos, y nos acercaremos mucho más a agentes generalistas del mundo real - capacidad de retroceder — más allá de la reflexión, GPT-5 podrá reconocer errores mientras responde y corregir el rumbo - niveles insanos de coherencia a través de datos a largo plazo... comenzaremos a pensar menos en usar sistemas separados para habilitar la memoria y más en simplemente incrustar todos los recuerdos en el aviso... esto también impulsará a los agentes hacia adelante - con estos últimos tres puntos, podrás dejar a GPT-5 solo y permitirle realizar tareas complejas por ti, y confiar en que realmente las hace bien sin necesidad de verificar su trabajo - entrenado con un OOM más de datos que los modelos anteriores, gran parte de los cuales se recopilaron de ChatGPT, limpiados, mejorados, convertidos a otras modalidades, etc. - post-entrenado con datos *mucho mejores* que los modelos líderes actuales - comenzaremos a ver destellos de capacidades muy por encima de lo que hablamos hoy — por ejemplo, tendrá habilidades más cercanas a ser utilizables para hacer investigación científica ¿Qué me perdí? ¿Qué piensas? Responde y házmelo saber.
6K