O pós-treinamento é uma forma de arte. @christinahkim diz que moldar o comportamento do modelo significa esculpir o caráter. Cada recompensa é uma compensação. O GPT-5 foi um reinício: equilibrando utilidade com honestidade, calor sem bajulação. O assistente não deve apenas responder. Deve parecer certo de usar.
15,2K