.@christinahkim dit que la frontière n'est plus les benchmarks. C'est l'utilisation. Les scores d'évaluation sont saturés, mais la vie quotidienne ne l'est pas. Le véritable indicateur de progrès est combien de personnes utilisent l'IA pour accomplir de réelles tâches. C'est ainsi que nous saurons que nous approchons de l'AGI.
23,73K