看到GPT-5的大路由器不断失败让我相信,“LLM作为法官”和用合成数据来训练更好的SOTA-LLM只是空想。
1.14K