Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Cristóbal Valenzuela
cofondateur, PDG @runwayml
Prenez un échantillon vidéo d'un ancien modèle et améliorez la qualité avec Runway Aleph. C'est l'équivalent de l'IA de la remastérisation numérique d'archives provenant d'une ancienne caméra à plaque des années 1890.
"améliorez la qualité de cette vidéo. elle doit être en haute résolution sans artefacts. un match de boxe est en cours."
3,56K
Dans des nouvelles totalement non liées, Gen-4 prendra désormais trois mois pour créer vos vidéos au lieu de 20 secondes. Le modèle générera également chaque pixel en les plaçant soigneusement sur l'écran, un à la fois, en utilisant une ancienne technique japonaise oubliée. Nous augmentons le prix par génération à 5 000 $ par seconde.

Cristóbal Valenzuela10 août, 04:57
Ce sentiment est en réalité un biais cognitif assez courant et étudié appelé heuristique de l'effort ou illusion de travail : les gens valorisent un résultat davantage lorsqu'ils croient qu'un plus grand effort ou un plus de temps a été consacré à sa production, même si le résultat est le même. Cela se produit souvent lorsque la valeur est difficile à déterminer, lorsque l'évaluateur manque d'expertise dans le sujet, ou que la chose que vous jugez est totalement nouvelle pour vous.


8,64K
Ce sentiment est en réalité un biais cognitif assez courant et étudié appelé heuristique de l'effort ou illusion de travail : les gens valorisent un résultat davantage lorsqu'ils croient qu'un plus grand effort ou un plus de temps a été consacré à sa production, même si le résultat est le même. Cela se produit souvent lorsque la valeur est difficile à déterminer, lorsque l'évaluateur manque d'expertise dans le sujet, ou que la chose que vous jugez est totalement nouvelle pour vous.


16,87K
Le contrôle vient en dernier cette fois. Mais il arrive.

Cristóbal Valenzuela14 nov. 2024
Je parle souvent de contrôle dans l'IA. Mais j'ai réalisé que parfois les gens pensent que je veux dire "meilleurs prompts". Voici donc mes réflexions sur ce que j'entends par contrôle : nous résolvons les graphiques à l'envers.
L'histoire des graphiques informatiques suit une progression claire : d'abord est venu le contrôle, puis la qualité. Il a fallu des décennies pour établir les bonnes abstractions - courbes, triangles, polygones, maillages - qui nous permettraient de dessiner exactement ce que nous voulions sur un écran. Ces blocs de construction fondamentaux n'ont pas beaucoup changé car ils se sont révélés être les bons. De la main d'Ed Catmull aux moteurs de jeu modernes, les principes fondamentaux de la façon dont nous contrôlons les pixels sont restés remarquablement stables. Les fondamentaux ont émergé non seulement pour le contrôle, mais aussi comme des moyens efficaces de décrire et de rendre des scènes complexes.
La qualité de rendu était la dernière frontière. Un cube modélisé en 1987 avec la première version de Renderman suit les mêmes principes géométriques qu'un cube modélisé dans Blender aujourd'hui. Ce qui est dramatiquement différent, c'est le rendu - l'éclairage, les matériaux, les ombres et les réflexions qui le rendent réel. L'industrie a passé des décennies à combler la vallée dérangeante, construisant des systèmes de rendu de plus en plus sophistiqués pour approcher le photoréalisme. Bien sûr, de nombreuses innovations graphiques ont amélioré à la fois le contrôle et la qualité simultanément, et l'histoire des progrès graphiques est plus complexe que simplement "contrôle puis qualité."
Mais cet ordre n'était pas arbitraire. Le pipeline graphique lui-même l'impose : la géométrie définit ce que nous voulons dessiner, les shaders déterminent à quoi cela ressemble. Même les moteurs en temps réel suivent ce schéma - établissant d'abord des contrôles de niveau de détail, puis améliorant la qualité de rendu dans ces contraintes.
L'IA a complètement inversé cette progression.
Les modèles génératifs d'aujourd'hui atteignent une qualité de rendu photoréaliste qui rivalise ou dépasse les pipelines traditionnels, apprenant efficacement l'ensemble de la pile graphique - de la géométrie à l'illumination globale - grâce à un entraînement à grande échelle. Ils ont effondré la séparation traditionnelle entre modélisation et rendu, créant un système de bout en bout capable de produire des images époustouflantes à partir de descriptions de haut niveau.
Ce qui manque, c'est le contrôle.
Bien que nous puissions générer des scènes photoréalistes en quelques secondes, nous manquons du contrôle précis que des décennies de recherche graphique ont fourni. Nous ne pouvons pas facilement ajuster la géométrie, peaufiner les matériaux ou manipuler l'éclairage avec la granularité que les artistes attendent. La nature déterministe des graphiques traditionnels - où chaque paramètre a un effet prévisible - a été remplacée par des modèles probabilistes.
C'est le problème des graphiques inverses : nous avons résolu le rendu avant de résoudre le contrôle. Nos modèles peuvent créer des images époustouflantes mais manquent des abstractions fondamentales qui ont rendu les graphiques informatiques si puissants - la capacité de faire des changements précis et intentionnels à n'importe quel niveau de détail.
Ce n'est pas une limitation permanente. Tout comme les graphiques informatiques ont finalement résolu le problème du rendu, l'IA résoudra le problème du contrôle. La question n'est pas si, mais comment. Nous trouvons les bonnes abstractions pour contrôler les modèles génératifs - l'équivalent des courbes, triangles et polygones qui ont révolutionné les graphiques informatiques auparavant. Je pense que les solutions pourraient avoir un aspect différent. De nouveaux primitifs pour le contrôle qui sont natifs des réseaux neuronaux pourraient être la bonne réponse plutôt que d'essayer d'imposer des concepts graphiques traditionnels dans ce nouveau paradigme. Bien que je pense aussi qu'il existe des approches hybrides combinant graphiques traditionnels et IA qui valent la peine d'être explorées.
L'objectif reste de fournir le même niveau de prévisibilité et de précision qui a fait des graphiques informatiques un outil fondamental pour l'expression créative. C'est l'objectif ultime, mais mieux : en temps réel, peu coûteux, et avec un contrôle précis qui soit aussi intuitif et polyvalent que possible.
Le contrôle vient en dernier cette fois. Mais il arrive.
5,1K
Un autre excellent exemple de la manière de contrôler précisément avec des interfaces personnalisées. Vous pouvez inviter Runway avec votre chemin personnalisé et toutes les annotations vidéo que vous souhaitez.
Invite+première vidéo : L'ovale bleu est un vaisseau spatial de type soucoupe volante qui survole la maison, et les particules sont son faisceau tracteur de lumière qui soulève la maison. Supprimez l'ovale bleu et les annotations de points.
7,12K
Oui ! Vous pouvez générer plusieurs vidéos simultanément en mode discussion.

Alin Cristian Tiganus (eyes2AI)7 août, 04:44
Je pensais que le mode Chat de @runwayml ne permettait qu'une seule génération à la fois. Il s'avère que j'avais tort. Maintenant, en plus de travailler avec Turbo, je peux exécuter deux générations simultanément, et peut-être que c'est juste moi, mais il semble suivre les instructions mieux dans le mode Chat. Je ne sais pas, mais ça semble juste juste, comme si je travaillais sans vraiment le sentir. Merci !
151
Tout ce que vous avez à faire, c'est de lui dire.

Jamie8 août, 06:21
Même vos séquences les plus ennuyeuses peuvent devenir un terrain de jeu avec @runwayml Aleph. Ajoutez-y. Modifiez-le. Ou, ajoutez-y une mouette. Et tout ce que vous avez à faire est de dire à Aleph ce que vous voulez.
3,09K
Meilleurs
Classement
Favoris
Tendance on-chain
Tendance sur X
Récents financements de premier plan
Les plus notables