Nous sommes ravis de lancer DailyBench ! DailyBench est un benchmark automatisé 4x quotidien qui évalue les API de modèles frontières sur un fork de HELMLite. J’ai construit DailyBench pour voir si nous pouvions détecter des fournisseurs de modèles quantifiant les poids, compressant le kv-cache ou échangeant des modèles pendant les pics de charge.
25,55K