Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
É uma pena que a OpenAI tenha sido menos rigorosa com os testes do GPT-5 do que com os seus modelos OS muito mais fracos.
A OpenAI tem os conjuntos de dados disponíveis para ajustar o GPT-5 e medir os riscos de armas biológicas do GPT-5 de forma mais precisa; eles simplesmente estão a escolher não fazê-lo.


6/08, 01:55
Crédito onde é devido:
A OpenAI fez muitas coisas certas nas suas avaliações de segurança OSS
- na verdade, fizeram algum fine-tuning
- obtiveram feedback externo útil
- partilharam quais recomendações adotaram e quais não adotaram
Nem sempre sigo a lógica da OAI, mas é ótimo que partilhem informações.


A OpenAI utiliza os mesmos bio-testes para os modelos OS e GPT-5, mas não criou uma versão "bio max" do GPT-5, embora o tenha feito para o modelo mais fraco.
Esta pode ser uma das razões pelas quais a OpenAI "não tem evidências definitivas" sobre o GPT-5 ser de alto risco.


Claro que, se o GPT-5 for roubado - algo que todos os principais laboratórios de IA acreditam ser possível - então a OpenAI não pode impedir quaisquer usos indevidos, assim como não pode para um modelo de SO.
Esta é a razão para realizar avaliações ajustadas: para saber o risco máximo real se for roubado.

Infelizmente, não está claro se a OpenAI impediu o roubo do seu modelo de alto risco, conforme exigido pelo seu Quadro de Preparação.
A descrição da OpenAI sobre os controles de segurança é bastante escassa e não diz 'investimos no nível específico que prometemos.' Gostaria de saber mais.



Estou bastante confuso sobre por que a OpenAI não realizou avaliações ajustadas para o GPT-5; eles têm os conjuntos de dados e a infraestrutura de ajuste fino.
Uma vez, a OpenAI se comprometeu com essa rigorosidade. Eu entendo por que eles poderiam voltar atrás se não tivessem os recursos, mas neste ponto, eles claramente parecem tê-los.

1,96K
Top
Classificação
Favoritos