Le très attendu GPT-5 est enfin arrivé. Cependant, deux testeurs du nouveau modèle interrogés par Reuters ont déclaré que, bien que les capacités de programmation de GPT-5 et sa capacité à résoudre des problèmes scientifiques et mathématiques soient très fortes, ils estiment que le saut de GPT-4 à GPT-5 n'est pas aussi grand que celui de GPT-3 à GPT-4. La raison du goulot d'étranglement est facile à comprendre : le manque de données. Il y a une expression très peu rigoureuse mais très évocatrice qui dit qu'à l'époque de l'entraînement de GPT-4, toutes les données pouvant être extraites d'Internet avaient déjà été collectées, donnant une impression de « avoir vu toute la splendeur du monde ». C'est pourquoi l'ancien chef scientifique d'OpenAI, Ilya Sutskever, a déclaré l'année dernière que, bien que la puissance de calcul augmente, la quantité de données n'a pas augmenté en parallèle. En fait, pour être franc, le sommet d'un AI généraliste pendant un certain temps sera probablement GPT-5, et par la suite, les entreprises d'IA se concentreront sur des IA spécialisées. Par exemple, comme l'a mentionné Ram Kumar, expert en IA d'OpenLedger dans cette interview, de nombreuses entreprises (comme Trust Wallet) souhaitent intégrer l'IA dans leurs portefeuilles, mais elles ne peuvent pas utiliser directement des modèles généraux - cela ne répond pas à des besoins spécifiques, il est donc nécessaire de personnaliser selon le scénario. OL fournit les protocoles et outils permettant de le faire. De plus, Bloomberg a commencé à développer BloombergGPT dès le départ, en s'appuyant sur les vastes données propriétaires, les nouvelles, les données d'entreprise et les textes de Bloomberg (totalisant plus de 700 milliards de balises) pour l'entraînement. C'est précisément à cause de ce corpus fermé qu'il sera largement supérieur aux LLMs généraux dans les tâches financières. Un autre exemple est le système de conduite autonome (FSD) de Tesla, qui est entraîné sur des milliards de kilomètres de vidéos et de données télémétriques collectées par Tesla elle-même, ce que ses concurrents n'ont pas. Ainsi, il y a quelques jours, Musk a laissé entendre que s'il pouvait également obtenir des données de conduite locales en Chine, Tesla pourrait réussir dans la compétition avec Dongchedi. Ainsi, la compétition future en IA sera certainement sur la voie des données spécialisées ; se fier uniquement à des données ordinaires massives provenant d'Internet ne suffira pas. C'est pourquoi le système de droits d'attribution des données développé par OpenLedger deviendra une nouvelle infrastructure. Imaginez, les données précieuses sont précieuses non seulement parce qu'elles sont rares, mais aussi parce qu'elles peuvent rapporter des bénéfices à leurs détenteurs (si vous considérez les données comme un actif), tout comme une maison peut générer des loyers, les données devraient également générer des « loyers de données ». Ram a déclaré dans la vidéo que Hugging Face est formidable, mais que 90 % des ensembles de données disponibles ne sont pas si utiles pour la mise en œuvre commerciale. Par conséquent, pour avoir une IA spécialisée commercialisable, il est nécessaire d'avoir d'abord un système de droits d'attribution des données, permettant aux détenteurs de données précieuses de les partager et de recevoir des bénéfices, encourageant ainsi davantage de détenteurs de données précieuses à participer, formant un cycle vertueux. L'égalité apportée par l'IA pourrait se cacher ici ; par le passé, les ressources des experts étaient précieuses, réservées à une classe privilégiée, car le temps des experts est limité. Mais à l'ère de l'IA, que se passe-t-il avec une IA spécialisée ? Elle réduit considérablement les coûts marginaux, rendant possible l'accès aux services de niveau expert ou quasi-expert pour les gens ordinaires. J'attends avec impatience le lancement du réseau principal d'OL.
Openledger
Openledger5 août, 14:11
.@TrustWallet est maintenant un client d'@OpenLedgerHQ, construisant officiellement avec notre technologie. Fier de soutenir l'un des portefeuilles les plus fiables de Web3 alors qu'il adopte l'IA vérifiable. Écoutez @Ramkumartweet et @EowynChen expliquer cela sur @therollupco.
5,07K