Bạn đã nghe tin này đầu tiên: GPT-5 thiết lập một SOTA mới trên FrontierMath (sử dụng khung công khai của chúng tôi, mà chúng tôi dùng để đánh giá các mô hình từ tất cả các nhà cung cấp). Với cả nỗ lực suy luận trung bình và cao, GPT-5 đạt được 25% (±3%) trên FrontierMath-2025-02-28-Private (tức là các cấp độ 1-3).
3,54K