Regarder le gros routeur de GPT-5 échouer constamment me convainc que « LLMs en tant que juges » et les données synthétiques pour former de meilleurs LLMs SOTA ne sont que des vœux pieux.
1,13K