ここで最初に聞いたと思います: GPT-5 は FrontierMath 上に新しい SOTA を確立します (すべてのプロバイダーのモデルを評価するために使用するパブリック スキャフォールドを使用します)。 中程度と高度な推論努力の両方で、GPT-5 は 25% (±3%) FrontierMath-2025-02-28-Private (つまり、ティア 1-3) で。
3.74K