Jeg tror folk undervurderer hvor mye dyrere det er å behandle bilder/videoer sammenlignet med tekst På tinder for anbefalingsalgoritmen antar de fleste at det er noe bilde/datasyn involvert, men det var 1000 ganger mer effektivt å gjøre cosinuslikhet med sveipemønstre Når det er sagt, er den neste slagmarken for modeller (og applikasjoner) bilder og videoer, og jeg tror det blir 1000 ganger mer spennende!
Ethan He
Ethan He7. aug., 03:32
AI brukte opp tekst fra hele internett. Men bilder er 1000 ganger større. Videoer er ytterligere 1000 ganger større på zettabyte. Det er mye flere videoer enn AI kan konsumere ennå. Videogenerering og verdensmodeller utvikler seg med lysets hastighet.
747