Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Vaibhav (VB) Srivastav
Officier en chef de la merde @huggingface | Fan de F1 | Ici pour la sagesse de @at_sofdog | *opinions les miennes
Ça me sidère toujours que vous puissiez charger un modèle de 20 MILLIARDS de paramètres nativement dans Colab 🤯

Vaibhav (VB) Srivastav7 août, 19:21
BOOOOM ! Vous pouvez maintenant exécuter @OpenAI gpt-oss 20B nativement dans @GoogleColab T4 GRATUITEMENT ! 🔥
Propulsé par Transformers ⚡
La configuration prend un peu de temps car tout est à la pointe de la technologie, mais une fois terminée, cela devrait fonctionner comme prévu.
Lien vers notre livre de recettes dans les commentaires 👇
2,93K
BOOOOM ! Vous pouvez maintenant exécuter @OpenAI gpt-oss 20B nativement dans @GoogleColab T4 GRATUITEMENT ! 🔥
Propulsé par Transformers ⚡
La configuration prend un peu de temps car tout est à la pointe de la technologie, mais une fois terminée, cela devrait fonctionner comme prévu.
Lien vers notre livre de recettes dans les commentaires 👇
34,16K
Vaibhav (VB) Srivastav a reposté
Vous voulez apprendre à aligner un Modèle de Langage de Vision (VLM) pour le raisonnement en utilisant GRPO et TRL ? 🌋
🧑🍳 Nous avons ce qu'il vous faut !!
Nouvelle recette de post-formation multimodale pour aligner un VLM en utilisant TRL dans le Cookbook de @huggingface.

10,2K
Vaibhav (VB) Srivastav a reposté
La lecture AI longue est de retour et nous venons de publier la lecture estivale ultime.
Inspiré par des publications comme Stripe Press, nous sommes fiers d'annoncer le premier livre de HF Press : une édition PDF de longueur livre soigneusement élaborée du Ultra-Scale Playbook.
Plus de 200 pages denses pour apprendre les fondamentaux et les avancés de :
- parallélisme 5D (DP, TP, PP, EP, FSDP)
- ZeRO
- Flash Attention
- chevauchement de calcul/communication et goulets d'étranglement
Tout cela avec des introductions théoriques accessibles et plus de 4 000 expériences de mise à l'échelle.
Tout ce que vous devez savoir pour entraîner votre propre DeepSeek V3 ou LLama 5 :)
Téléchargez-le gratuitement avec votre abonnement HF PRO ✨
Obtenez-le à :

50,01K
rappel : certaines personnes vraiment talentueuses ont consacré beaucoup de temps à construire quelque chose de précieux pour la communauté
ne dévalorisez pas leurs efforts en faisant des commentaires, des réactions et des rumeurs odieuses sur leur travail sans avoir l'ensemble du tableau
être un peu compréhensif va loin !
6,15K
Meilleurs
Classement
Favoris
Tendance on-chain
Tendance sur X
Récents financements de premier plan
Les plus notables