Il post-addestramento è una forma d'arte. @christinahkim afferma che plasmare il comportamento del modello significa scolpire il carattere. Ogni ricompensa è un compromesso. GPT-5 è stato un reset: bilanciare utilità con onestà, calore senza adulazione. L'assistente non dovrebbe solo rispondere. Dovrebbe essere piacevole da usare.
16,16K