¡Hemos estado ocupados últimamente: nuevas arenas, nuevos modelos y nuevas metodologías! Así que hemos creado una página de registro de cambios donde puedes seguir todas las actualizaciones que hacemos a las tablas de clasificación. Además de la nueva Arena de Búsqueda y nuevos modelos como el último Imagen 4, Grok 4, Kimi K2, Seedream 3 y SeedEdit 3, también hemos realizado algunas actualizaciones metodológicas: ☑️ Mantener una alta integridad al fortalecer nuestro procesamiento de deduplicación y filtrado de identidad para asegurar que se utilicen datos frescos y no sesgados en las tablas de clasificación. ☑️ Optimizar el rendimiento al pasar de intervalos de confianza bootstrap a una versión en forma cerrada. ☑️ Reponderar los datos de votación para representar de manera más equitativa los modelos con menos datos recopilados.
20,24K