Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Cristóbal Valenzuela
Cofundador CEO @runwayml
En noticias totalmente no relacionadas, Gen-4 ahora tomará tres meses para hacer tus videos en lugar de 20 segundos. El modelo también generará cada píxel colocándolos cuidadosamente en la pantalla, uno a la vez, utilizando una antigua técnica japonesa olvidada. Estamos aumentando el precio por generación a $5,000 por segundo.

Cristóbal Valenzuelahace 6 horas
Este sentimiento es en realidad un sesgo cognitivo bastante común y estudiado llamado heurísticas de esfuerzo o ilusión del trabajo: las personas valoran más un resultado cuando creen que se ha invertido una mayor cantidad de esfuerzo o tiempo en producirlo, incluso si el resultado es el mismo. Esto sucede mucho cuando es difícil determinar el valor, cuando el evaluador carece de experiencia en el tema, o cuando lo que estás juzgando es totalmente nuevo para ti.


5K
Este sentimiento es en realidad un sesgo cognitivo bastante común y estudiado llamado heurísticas de esfuerzo o ilusión del trabajo: las personas valoran más un resultado cuando creen que se ha invertido una mayor cantidad de esfuerzo o tiempo en producirlo, incluso si el resultado es el mismo. Esto sucede mucho cuando es difícil determinar el valor, cuando el evaluador carece de experiencia en el tema, o cuando lo que estás juzgando es totalmente nuevo para ti.


9.79K
El control viene al final esta vez. Pero está llegando.

Cristóbal Valenzuela14 nov 2024
A menudo hablo sobre el control en la IA. Pero me he dado cuenta de que a veces la gente piensa que me refiero a "mejores prompts". Así que aquí están mis pensamientos sobre lo que quiero decir con control: estamos resolviendo gráficos al revés.
La historia de los gráficos por computadora sigue una progresión clara: primero vino el control, luego la calidad. Tomó décadas establecer las abstracciones correctas - curvas, triángulos, polígonos, mallas - que nos permitirían dibujar exactamente lo que queríamos en una pantalla. Estos bloques de construcción fundamentales no han cambiado mucho porque demostraron ser los correctos. Desde la mano de Ed Catmull hasta los motores de juego modernos, los principios básicos de cómo controlamos los píxeles han permanecido notablemente estables. Los fundamentos surgieron no solo para el control, sino como formas eficientes de describir y renderizar escenas complejas.
La calidad de renderizado fue la última frontera. Un cubo modelado en 1987 usando la primera versión de Renderman sigue los mismos principios geométricos que uno modelado en Blender hoy. Lo que es dramáticamente diferente es el renderizado - la iluminación, los materiales, las sombras y los reflejos que lo hacen sentir real. La industria pasó décadas cerrando el valle inquietante, construyendo sistemas de renderizado cada vez más sofisticados para acercarse al fotorrealismo. Por supuesto, muchas innovaciones gráficas mejoraron tanto el control como la calidad simultáneamente, y la historia del progreso gráfico es más compleja que solo "control luego calidad."
Pero este orden no fue arbitrario. La propia tubería gráfica lo impone: la geometría define lo que queremos dibujar, los shaders determinan cómo se ve. Incluso los motores en tiempo real siguen este patrón - primero estableciendo controles de nivel de detalle, luego mejorando la calidad de renderizado dentro de esas limitaciones.
La IA ha invertido completamente esta progresión.
Los modelos generativos de hoy logran una calidad de renderizado fotorrealista que rivaliza o supera a las tuberías tradicionales, aprendiendo efectivamente toda la pila gráfica - desde la geometría hasta la iluminación global - a través de un entrenamiento a gran escala. Han colapsado la separación tradicional entre modelado y renderizado, creando un sistema de extremo a extremo que puede producir imágenes impresionantes a partir de descripciones de alto nivel.
Lo que falta es control.
Mientras podemos generar escenas fotorrealistas en segundos, carecemos del control preciso que décadas de investigación gráfica proporcionaron. No podemos ajustar fácilmente la geometría, afinar materiales o manipular la iluminación con la granularidad que los artistas esperan. La naturaleza determinista de los gráficos tradicionales - donde cada parámetro tiene un efecto predecible - ha sido reemplazada por modelos probabilísticos.
Este es el problema de los gráficos inversos: hemos resuelto el renderizado antes de resolver el control. Nuestros modelos pueden crear imágenes impresionantes pero carecen de las abstracciones fundamentales que hicieron que los gráficos por computadora fueran tan poderosos - la capacidad de hacer cambios precisos e intencionales a cualquier nivel de detalle.
Esta no es una limitación permanente. Así como los gráficos por computadora eventualmente resolvieron el problema de renderizado, la IA resolverá el problema de control. La pregunta no es si, sino cómo. Estamos encontrando las abstracciones correctas para controlar modelos generativos - el equivalente de las curvas, triángulos y polígonos que revolucionaron los gráficos por computadora antes. Creo que las soluciones podrían verse diferentes. Nuevos primitivos para el control que son nativos de las redes neuronales podrían ser la respuesta correcta en lugar de intentar forzar conceptos gráficos tradicionales en este nuevo paradigma. Aunque también creo que hay enfoques híbridos que combinan gráficos tradicionales con IA que valen la pena explorar.
El objetivo sigue siendo proporcionar el mismo nivel de predictibilidad y precisión que hizo de los gráficos por computadora una herramienta fundamental para la expresión creativa. Ese es el objetivo final, pero mejor: en tiempo real, barato y con un control preciso que sea tan intuitivo y de propósito general como sea posible.
El control viene al final esta vez. Pero está en camino.
4.13K
Otro gran ejemplo de cómo lograr un control preciso con interfaces personalizadas. Puedes indicarle a Runway tu ruta personalizada y las anotaciones de video que desees.
Indicación+primer video: El óvalo azul es un platillo volador que vuela sobre la casa, y las partículas son su rayo tractor de luz que levanta la casa. Elimina el óvalo azul y las anotaciones de puntos.
4.64K
¡Sí! Puedes generar muchos videos simultáneamente en Modo Chat.

Alin Cristian Tiganus (eyes2AI)7 ago, 04:44
Pensé que el Modo Chat de @runwayml solo permitía una generación a la vez. Resulta que estaba equivocado. Ahora, además de trabajar con Turbo, puedo ejecutar dos generaciones simultáneamente, y tal vez solo sea yo, pero parece seguir mejor los prompts dentro del Modo Chat. No lo sé, pero simplemente se siente bien, como si estuviera trabajando pero sin sentirlo. ¡Gracias!
103
Todo lo que necesitas hacer es decírselo.

Jamie8 ago, 06:21
Incluso tu metraje más aburrido puede convertirse en un parque de diversiones con @runwayml Aleph. Agrégale algo. Modifícalo. O, añade una gaviota. Y todo lo que necesitas hacer es decirle a Aleph lo que quieres.
2.77K
Cristóbal Valenzuela reposteó
Runway Aleph tiene control granular de objetos. Lo que significa que puedes agregar o alterar tu video de maneras que se sienten tanto naturales como realistas sin necesidad de indicaciones complejas o key framing. O, puedes romper las leyes de la física por completo. Todo lo que necesitas hacer es decirle a Aleph lo que quieres.
43.78K
Este era el objetivo desde el principio. Quitar al hombre, mantener el destello de la lente y hacer que un ratón se acerque a la lente de la cámara.

Cristóbal Valenzuela1 ago, 13:51
Este es un caso difícil. Elimina al hombre pero mantén los destellos de lente. Maravillosa magia de Aleph.
15.51K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas