Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Es una pena que OpenAI haya sido menos rigurosa con las pruebas de su GPT-5 que con sus modelos OS mucho más débiles.
OpenAI tiene los conjuntos de datos disponibles para ajustar finamente GPT-5 y medir los riesgos de armas biológicas de GPT-5 de manera más precisa; simplemente están eligiendo no hacerlo.


6 ago, 01:55
Crédito donde se debe:
OpenAI hizo muchas cosas bien en sus evaluaciones de seguridad de OSS
- realmente hicieron un ajuste fino
- obtuvieron comentarios externos útiles
- compartieron qué recomendaciones adoptaron y cuáles no
No siempre sigo la lógica de OAI, pero es genial que compartan información.


OpenAI utiliza las mismas pruebas biológicas para los modelos de OS y GPT-5, pero no creó una versión "bio max" de GPT-5, aunque sí lo hicieron para el modelo más débil.
Esta podría ser una razón por la que OpenAI "no tiene evidencia definitiva" sobre que GPT-5 sea de alto riesgo.


Por supuesto, si GPT-5 es robado - algo que todos los principales laboratorios de IA creen que es posible - entonces OpenAI no puede detener ningún uso indebido, así como no pueden hacerlo con un modelo de sistema operativo.
Esta es la razón para realizar evaluaciones ajustadas: para conocer el riesgo máximo real si es robado.

Desafortunadamente, no está claro que OpenAI haya prevenido el robo de su modelo de alto riesgo, como se requiere en su Marco de Preparación.
El informe de OpenAI sobre los controles de seguridad es bastante escaso y no dice 'hemos invertido al nivel específico que prometimos.' Me gustaría saber más.



Estoy bastante confundido sobre por qué OpenAI no realizó evaluaciones ajustadas para GPT-5; tienen los conjuntos de datos y la infraestructura de ajuste fino.
Una vez, OpenAI se comprometió con este rigor. Entiendo por qué podrían retractarse si no tienen los recursos, pero en este punto, claramente parecen tenerlos.

1.95K
Populares
Ranking
Favoritas