Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Matt Shumer
Tout le monde passe à côté de la raison évidente pour laquelle GPT-5 ne semble pas être un grand saut :
Les progrès de l'IA ne semblent plus exponentiels, mais ils avancent toujours aussi vite que jamais.
Entre GPT-3 et GPT-4, nous n'avons presque pas vu de sorties de modèles significatives entre les deux, donc GPT-4 a semblé révolutionnaire à sa sortie.
Mais après GPT-4, nous avons vu des dizaines, peut-être des centaines, d'améliorations incrémentielles de la part d'OpenAI, Anthropic, Google, Meta et d'autres. Au moment où GPT-5 est arrivé, nous avions déjà expérimenté beaucoup de sa "magie" en doses plus petites.
Cependant, si vous comparez directement GPT-4 au lancement avec GPT-5 aujourd'hui, le saut en capacités est tout aussi dramatique que celui de GPT-3 à GPT-4... nous nous sommes juste habitués aux mises à jour incrémentielles.
Les choses ne ralentissent pas.
8,01K
Maintenant que GPT-5 est sorti, que pensez-vous de ma performance ?
Mes prédictions pour le modèle étaient-elles correctes ?

Matt Shumer15 avr. 2024
Mes prédictions pour les capacités de GPT-5 :
Du moins intéressant au plus intéressant :
- une longueur de contexte significativement plus longue + une bien plus grande capacité à l'utiliser efficacement (c'est-à-dire la capacité de raisonner à travers des aiguilles dans des tests de foin)
- beaucoup plus multimodal (tant en termes de nombre de modalités que de la profondeur de chacune)
- sorties multimodales, bien que je suppose que certaines modalités seront désactivées au lancement (sécurité, etc. etc.)
- imaginez parler directement à GPT-5, et il répond, sans utiliser Whisper ou Voice Engine
- percée en raisonnement Q*
- Deux modes : raisonnement + normal — Q* peut nécessiter un temps/coût d'inférence significatif, donc à moins qu'il n'y ait une percée d'efficacité, ils pourraient également offrir un mode de réponse normal comme nous le voyons aujourd'hui
- De même, GPT-5 pourrait avoir une forme plus avancée de calcul adaptatif/utilisation de Q*… plus la requête est difficile, plus il met de puissance derrière pour fournir une excellente solution
- capacités agentiques 10x meilleures… les agents simples/contraints seront principalement résolus, et nous nous rapprocherons beaucoup plus des agents généralistes du monde réel
- capacité de revenir en arrière — au-delà de la réflexion, GPT-5 sera capable de reconnaître des erreurs au fur et à mesure qu'il répond, et de corriger le tir
- niveaux de cohérence incroyables à travers des données à long terme… nous commencerons à penser moins à utiliser des systèmes séparés pour activer la mémoire et plus à simplement intégrer tous les souvenirs dans l'invite… cela fera également avancer les agents
- avec ces trois derniers points, vous pourrez laisser GPT-5 seul et lui faire réaliser des tâches complexes pour vous, en ayant confiance qu'il les réalise correctement sans avoir besoin de vérifier son travail
- entraîné sur un OOM de données de plus que les modèles précédents, dont une grande partie est collectée à partir de ChatGPT, nettoyée, améliorée, adaptée à d'autres modalités, etc.
- post-entraîné sur des données bien *meilleures* que les modèles leaders actuels
- nous commencerons à voir des aperçus de capacités bien au-delà de ce dont nous parlons aujourd'hui — par exemple, il aura des capacités plus proches de l'utilisation pour faire de la recherche scientifique
Qu'ai-je manqué ? Qu'en pensez-vous ?
Répondez et faites-le moi savoir.
5,64K
Le nouvel agent Rork est, de loin, le meilleur agent de création d'applications mobiles au monde.
Si vous cherchez à créer une application iOS ou Android, vous devez l'essayer.
Dès que possible.

Rorkil y a 18 heures
Présentation du nouvel Agent Rork pour les applications mobiles
・90 % d'erreurs en moins grâce aux corrections automatiques
・Nouveaux outils agentiques puissants
・10 fois plus intelligent avec les meilleures pratiques de Claude Code
・Produit la meilleure interface utilisateur – en utilisant à la fois GPT-5 et Sonnet 4
Le meilleur agent pour les applications mobiles est là 👇

7,12K
Beaucoup de gens qui ont une mauvaise expérience utilisent GPT-5 dans des systèmes d'agent qui ne sont pas encore optimisés pour cela.
Pour chaque nouvelle version de modèle, il y a un délai entre la sortie et le moment où les entreprises qui intègrent le modèle le font fonctionner correctement.
Les entreprises d'agents se précipitent pour changer le paramètre du modèle dans leur code pour `gpt-5` ou quel que soit le modèle le plus récent, et cela fonctionne assez bien, mais il faut des jours à des semaines pour que le modèle fonctionne réellement comme prévu (des ajustements de prompt, de système et d'outils sont presque toujours nécessaires, pour refléter comment le modèle a été entraîné).
Si vous avez eu une mauvaise expérience en utilisant GPT-5 dans un système de codage (@cline, @cursor_ai, etc.), attendez une semaine et réessayez. Je pense que vous serez agréablement surpris.
14,96K
Rork vient de recevoir une énorme mise à jour. GPT-5 le rend 10 fois plus capable.
Si vous avez toujours voulu créer une application iPhone, essayez-la maintenant !!

Rork8 août, 03:42
GPT-5 est maintenant dans Rork.
Et c'est incroyable.
→ 190 % meilleur que Claude 4 sur le benchmark de l'application mobile de Rork
→ Meilleur en raisonnement/logique
→ Crée des interfaces utilisateur très belles
Essayez-le maintenant dans Rork. Faites-nous savoir ce que vous en pensez !
Et restez à l'écoute. Nous n'avons pas fini.
Une mise à jour encore plus importante arrive bientôt 👀

5,62K
Matt Shumer a reposté
GPT-5 est en ligne dans Cline.
Nous avons travaillé avec OpenAI pour préparer ce modèle, et voici notre avis : il est discipliné, persévérant et très compétent.
Il est collaboratif dans la planification et un opérateur diligent lors de l'exécution.
Il planifie de manière approfondie, pose des questions de suivi optionnelles lorsque c'est nécessaire, puis se met de côté et expédie le code. Sur les tâches longues, il continue avant de faire une pause pour vérifier.
Il suit les instructions à la lettre. Et surtout -- il écrit du bon code.
GPT-5 est comme "Le Loup" de Pulp Fiction. Il arrive, évalue la situation, puis exécute.
Voici ce à quoi vous pouvez vous attendre de GPT-5 dans Cline :
> verbeux lors de la planification ; concis lors de l'exécution
> pose beaucoup de bonnes questions de clarification et fournit fréquemment des options lorsque c'est approprié
> forte rétention de contexte et persistance sur de longues périodes (fenêtre de contexte de 256k)
> bon pour les modifications de style diff et les changements multi-fichiers (nous surveillerons à mesure que plus de données d'utilisation arriveront)
> silencieux en mode Acte -- écrit du code sans bavarder
Le métaprompting est une autre force. Nous avons testé tôt avec OpenAI et utilisé GPT-5 pour ajuster notre propre prompt pour GPT-5. Voici un modèle que nous aimons :
"Répondez de votre propre perspective : quels changements ou ajouts vous aideraient à mieux suivre ce prompt ? Voici le prompt (ou extrait) : [extrait]. Les utilisateurs se sont plaints de X et Y. Quelles modifications minimales feriez-vous tout en gardant le reste intact ?"
Avez-vous besoin de changer l'un de vos modèles existants dans Cline ? Non -- il est bon dès le départ. Donnez un objectif clair et des contraintes, laissez-le planifier, puis laissez-le cuisiner. Attendez-vous à plus de questions de clarification que la plupart des modèles.
Tarification : 1,25 $/M tokens d'entrée (+90 % de cache), 10 $/M de sortie. Environ la moitié de Sonnet 4 (3 $/15 $).
Vous voulez essayer GPT-5 ? Utilisez-le dans Cline aujourd'hui pour une inférence pure et non filtrée via les fournisseurs OpenAI, Cline ou OpenRouter.
(au fait -- GPT-5 a réalisé ce DAW de navigateur ci-dessous en une seule fois sur le prompt "construisez quelque chose d'impressionnant pour me montrer de quoi vous êtes capable")
55,27K
Meilleurs
Classement
Favoris
Tendance on-chain
Tendance sur X
Récents financements de premier plan
Les plus notables