Post-Training ist eine Kunstform. @christinahkim sagt, dass das Formen des Verhaltens von Modellen bedeutet, Charakter zu gestalten. Jede Belohnung ist ein Kompromiss. GPT-5 war ein Neustart: das Gleichgewicht zwischen Hilfsbereitschaft und Ehrlichkeit, Wärme ohne Schmeichelei. Der Assistent sollte nicht nur antworten. Es sollte sich richtig anfühlen, ihn zu benutzen.
15,21K