Я думаю, что люди недооценивают, насколько дороже обрабатывать изображения/видео по сравнению с текстом. В Tinder для алгоритма рекомендаций большинство людей предполагает, что задействованы какие-то изображения/компьютерное зрение, но на самом деле было в 1000 раз эффективнее использовать косинусное сходство с паттернами свайпов. Сказав это, следующая битва для моделей (и приложений) — это изображения и видео, и я думаю, что это будет в 1000 раз более захватывающе!
Ethan He
Ethan He7 авг., 03:32
Искусственный интеллект исчерпал текст из всего интернета. Но изображения в 1000 раз больше. Видео в еще 1000 раз больше, достигая зеттабайтов. Видео гораздо больше, чем ИИ может пока обработать. Генерация видео и мировые модели развиваются со скоростью света.
755