Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Cristóbal Valenzuela
Співзасновник, генеральний директор @runwayml
Що стосується абсолютно не пов'язаних між собою новин, то Gen-4 тепер займе три місяці, щоб зробити ваші відео замість 20 секунд. Модель також буде генерувати кожен піксель, акуратно розміщуючи їх на екрані, по одному, використовуючи стару, забуту японську техніку. Ми збільшуємо ціну за покоління до $5 000 за секунду.

Cristóbal Valenzuela10 серп., 04:57
Це почуття насправді є досить поширеним і вивченим когнітивним упередженням, яке називається евристикою зусиль або трудовою ілюзією: люди більше цінують результат, коли вони вважають, що на його створення було витрачено більше зусиль або часу, навіть якщо результат однаковий. Це часто трапляється, коли цінність важко визначити, коли оцінювачу не вистачає знань у цій темі, або річ, яку ви оцінюєте, є для вас абсолютно новою.


8,62K
Це почуття насправді є досить поширеним і вивченим когнітивним упередженням, яке називається евристикою зусиль або трудовою ілюзією: люди більше цінують результат, коли вони вважають, що на його створення було витрачено більше зусиль або часу, навіть якщо результат однаковий. Це часто трапляється, коли цінність важко визначити, коли оцінювачу не вистачає знань у цій темі, або річ, яку ви оцінюєте, є для вас абсолютно новою.


16,85K
Контроль цього разу йде на останньому місці. Але він наближається.

Cristóbal Valenzuela14 лист. 2024 р.
Я часто говорю про управління в ШІ. Але я зрозумів, що іноді люди думають, що я маю на увазі «кращі підказки». Отже, ось мої думки про те, що я маю на увазі під контролем: ми вирішуємо графіку у зворотному порядку.
Історія комп'ютерної графіки йде по чіткій прогресії: спочатку йшов контроль, потім якість. Знадобилися десятиліття, щоб встановити правильні абстракції - криві, трикутники, багатокутники, сітки - які дозволили б нам намалювати на екрані саме те, що ми хотіли. Ці фундаментальні будівельні блоки не сильно змінилися, тому що вони виявилися правильними. Від руки Еда Кетмулла до сучасних ігрових рушіїв, основні принципи того, як ми керуємо пікселями, залишаються напрочуд стабільними. Основи з'явилися не лише для керування, а й як ефективні способи опису та рендерингу складних сцен.
Якість рендера була останнім рубежем. Куб, змодельований у 1987 році з використанням першої версії Renderman, дотримується тих самих геометричних принципів, що й той, що моделюється в Blender сьогодні. Що кардинально відрізняється, так це рендеринг - освітлення, матеріали, тіні та відблиски, які створюють відчуття реальності. Індустрія витратила десятиліття на закриття моторошної долини, створюючи все більш складні системи рендерингу для наближення до фотореалізму. Звичайно, багато графічних нововведень покращили і контроль, і якість одночасно, а історія прогресу графіки складніша, ніж просто «контроль, а потім якість».
Але цей наказ не був довільним. Сам графічний конвеєр забезпечує це: геометрія визначає, що ми хочемо намалювати, шейдери визначають, як це виглядає. Навіть двигуни реального часу дотримуються цього шаблону - спочатку встановлюючи контроль рівня деталізації, а потім покращуючи якість рендерингу в рамках цих обмежень.
Штучний інтелект повністю перевернув цю прогресію.
Сучасні генеративні моделі досягають фотореалістичної якості рендерингу, яка конкурує з традиційними конвеєрами або перевершує їх, ефективно навчаючись усьому графічному стеку - від геометрії до глобального освітлення - за допомогою масштабного навчання. Вони зруйнували традиційний поділ між моделюванням і рендерингом, створивши наскрізну систему, яка може створювати приголомшливі зображення з високорівневих описів.
Чого не вистачає, так це контролю.
Хоча ми можемо генерувати фотореалістичні сцени за лічені секунди, нам не вистачає точного контролю, який забезпечували десятиліття графічних досліджень. Ми не можемо легко налаштувати геометрію, точно налаштувати матеріали або маніпулювати освітленням з тією деталізацією, якої очікують художники. Детермінований характер традиційної графіки, де кожен параметр має передбачуваний ефект, був замінений імовірнісними моделями.
Це проблема зворотної графіки: ми розв'язали рендеринг перед розв'язанням керування. Наші моделі можуть створювати приголомшливі зображення, але їм не вистачає фундаментальних абстракцій, які зробили комп'ютерну графіку такою потужною - здатності вносити точні, навмисні зміни на будь-якому рівні деталізації.
Це не є постійним обмеженням. Подібно до того, як комп'ютерна графіка в кінцевому підсумку вирішила проблему рендерингу, штучний інтелект вирішить проблему управління. Питання не в тому, якщо, а в тому, як. Ми знаходимо правильні абстракції для управління генеративними моделями - еквівалент кривих, трикутників і полігонів, які зробили революцію в комп'ютерній графіці раніше. Я думаю, що рішення можуть виглядати по-різному. Нові примітиви для керування, які є рідними для нейронних мереж, можуть бути правильною відповіддю, а не спробою нав'язати традиційні графічні концепції цій новій парадигмі. Хоча я також вважаю, що існують гібридні підходи, що поєднують традиційну графіку зі штучним інтелектом, які варто вивчити.
Метою залишається забезпечити той самий рівень передбачуваності та точності, який зробив комп'ютерну графіку основним інструментом для творчого самовираження. Це кінцева мета, але краща: в режимі реального часу, дешево і з точним управлінням, яке є максимально інтуїтивно зрозумілим і універсальним.
Контроль цього разу йде на останньому місці. Але він наближається.
4,87K
Ще один чудовий приклад того, як забезпечити точне керування за допомогою персоналізованих інтерфейсів. Ви можете підказати Злітно-посадковій смузі свій персоналізований шлях і будь-які відеоанотації, які вам потрібні.
Підказка+перше відео: Синій овал – це космічний корабель з літаючою тарілкою НЛО, який пролітає над будинком, а частинки – це його тракторний промінь світла, який піднімає будинок вгору. Видаліть сині, овальні та точкові анотації.
7,08K
Так! Ви можете генерувати багато відео одночасно в режимі чату.

Alin Cristian Tiganus (eyes2AI)7 серп., 04:44
Я думав, що режим чату від @runwayml дозволяє використовувати лише одне покоління за раз. Виявляється, я помилявся. Тепер, крім роботи з Turbo, я можу запускати два покоління одночасно, і, можливо, це тільки я, але, здається, він краще слідує підказкам у режимі чату. Я не знаю, але це просто здається правильним, ніби я працюю, але не відчуваю цього. Дякую!
125
Все, що вам потрібно зробити, це сказати йому.

Jamie8 серп., 06:21
Навіть найнудніші кадри можуть стати ігровим майданчиком з @runwayml Aleph. Доповніть його. Змініть його. Або ж додати до нього чайку. І все, що вам потрібно зробити, це сказати Алефу, чого ви хочете.
3,07K
Користувач Cristóbal Valenzuela поділився
Злітно-посадкова смуга Aleph має детальне управління об'єктами. Це означає, що ви можете додавати або змінювати своє відео природним і реалістичним чином, без будь-яких складних підказок або ключових кадрів. А можна взагалі порушити закони фізики. Все, що вам потрібно зробити, це сказати Алефу, чого ви хочете.
45,8K
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги