Å se GPT-5s store ruter fortsette å mislykkes for meg overbeviser meg om at "LLM-er som dommere" og syntetiske-data-for-å-trene-bedre-SOTA-LLM-er bare er ønsketenkning.
1,16K