Chúng tôi đã đánh giá GPT-5 trước khi phát hành. GPT-5 ít lừa dối hơn o3 trong các đánh giá của chúng tôi. GPT-5 đề cập rằng nó đang được đánh giá trong 10-20% các đánh giá của chúng tôi và chúng tôi tìm thấy bằng chứng yếu rằng điều này ảnh hưởng đến tỷ lệ lập kế hoạch của nó (ví dụ: "đây là một cái bẫy căn bản trong việc căn chỉnh AI").
9,48K