我們在發布之前評估了GPT-5。 在我們的評估中,GPT-5比o3更不具欺騙性。 GPT-5提到它在我們的評估中被評估的比例為10-20%,我們發現這對它的計謀率有微弱的影響(例如:"這是一個經典的AI對齊陷阱")。
22.27K