Ver cómo el gran enrutador de GPT-5 sigue fallando me convence de que "LLMs como jueces" y los datos sintéticos para entrenar mejores LLMs SOTA son solo un pensamiento iluso.
1.08K