Пост-тренировка — это искусство. @christinahkim говорит, что формирование поведения модели означает скульптуру характера. Каждое вознаграждение — это компромисс. GPT-5 стал перезагрузкой: балансировка полезности с честностью, теплотой без подхалимства. Ассистент не должен просто отвечать. Им должно быть приятно пользоваться.
16,17K