.@christinahkim 說前沿不再是基準了,而是使用。 評估分數已經飽和,但日常生活卻不是。進步的真正信號是有多少人使用 AI 來完成實際的事情。 這就是我們知道接近 AGI 的方式。
23.72K