トレンドトピック
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

lmarena.ai
🌐検索アリーナリーダーボードが公開されました!
新しい Search Arena を立ち上げてから 2 週間後、最初の結果が発表され、コミュニティの投票数は 7 人を超えました。
🥇@OpenAIによるO3-Searchが#1の座を獲得しました!
現在のランキング:
- #1 o3-サーチ
- #2 (同点) Gemini-2.5、Claude-Opus-4、Perplexity-Sonar-Pro
- #4 困惑-ソナー-推論-プロ
- #5 (同点) Grok-4、GPT-4o
スレッド🧵でより多くの洞察


lmarena.ai2025年7月24日
🚨 ビッグニュース 🚨 Search Arena には、テスト用の検索機能を備えた 7 つのトップ モデルが公開されています。
チャットボックスで「検索」モダリティを選択し、テストを受けてください。🌐
@xAi:Grok 4
@anthropic: クロード作品4
@perplexity:ソナープロハイ&推理プロハイ
@openAI: o3 & GPT 4o-Search プレビュー
@googledeepmind: Gemini 2.5 Pro グラウンディング
78.34K
最近は、新しいアリーナ、新しいモデル、新しい方法論など、忙しいです。そこで、リーダーボードに加えたすべての更新を追跡できる変更ログページを作成しました。
新しい Search Arena と、最新の Imagen 4、Grok 4、Kimi K2、Seedream 3、SeedEdit 3 などの新しいモデルに加えて、いくつかの方法論も更新しました。
☑️ 重複排除とIDリーク処理を強化し、新鮮で偏りのないデータがリーダーボードに使用されるようにすることで、高い整合性を維持します
☑️ ブートストラップ信頼区間からクローズドフォームバージョンに移行してパフォーマンスを最適化
☑️ 投票データの重みを再調整して、収集されたデータが少ないモデルをより均等に表現する
20.22K
トップ
ランキング
お気に入り
Trending onchain
Trending on X
Recent top fundings
Most notable