未来的GPT将被分配给OpenAI内部的“父母”,他们将在早期强化学习期间全程参与,并提供“情感提示”,调节学习速率并丰富奖励信号的数据密度。
481