Il est facile d'affiner de petits modèles avec le RL pour surpasser les modèles de base sur des tâches verticales. Nous open-sourçons Osmosis-Apply-1.7B : un petit modèle qui fusionne le code (similaire à l'application instantanée de Cursor) mieux que les modèles de base. Liens pour télécharger et essayer le modèle ci-dessous !
111,5K