Forçar os LLMs a serem maus durante o treinamento pode torná-los mais agradáveis a longo prazo
6,61K