最近は、新しいアリーナ、新しいモデル、新しい方法論など、忙しいです。そこで、リーダーボードに加えたすべての更新を追跡できる変更ログページを作成しました。 新しい Search Arena と、最新の Imagen 4、Grok 4、Kimi K2、Seedream 3、SeedEdit 3 などの新しいモデルに加えて、いくつかの方法論も更新しました。 ☑️ 重複排除とIDリーク処理を強化し、新鮮で偏りのないデータがリーダーボードに使用されるようにすることで、高い整合性を維持します ☑️ ブートストラップ信頼区間からクローズドフォームバージョンに移行してパフォーマンスを最適化 ☑️ 投票データの重みを再調整して、収集されたデータが少ないモデルをより均等に表現する
20.25K