热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
万众瞩目的 GPT-5 终于来了。
不过路透社采访的两位新模型测试者却说,尽管 GPT-5 的编程能力和解决科学和数学问题的能力很强,但他们认为从 GPT-4 到 GPT-5 的飞跃不如从 GPT-3 到 GPT-4 那么大。
瓶颈原因不难理解——数据不够。
有个非常不严谨但是非常形象的说法是,当时 GPT-4 训练时已经把能从互联网上抓取的数据基本都抓取尽了,有种类似于阅尽世界繁华的感觉。
所以,曾经 OpenAI 首席科学家Ilya Sutskever 去年才会说,虽然计算能力在增长,但数据量并未同步增加。
其实坦率来讲,一个通才型的 AI 很长一段时间内的巅峰大概也就是 GPT-5 了,而接下来各类 AI 公司卷的一定是专家型的 AI。
比如说这个采访里 OpenLedger 的 AI 专家 Ram Kumar 提到的,很多甲方(例如 Trust Wallet),想把 AI 融进钱包,但他们不能直接用通用模型——满足不了特定需求,必须按场景定制,OL 提供的就是让大家能这么做的协议与工具。
再比如说,当年彭博社第一时间就开始研发 BloombergGPT,基于彭博庞大的专有终端、新闻、企业数据和文本(总计超过 7000 亿个标记)进行训练。正是因为这个封闭语料库,它在金融任务上一定会大幅优于通用LLMs。
再比如马斯克的特斯拉(FSD)自动驾驶,基于特斯拉独自收集的数十亿英里的车队视频/遥测数据进行训练,这是特斯拉竞争对手没有的。所以前几天,马斯克暗示,如果他也可以拿中国本地的驾驶相关的数据,在之前懂车帝的竞赛里,特斯拉可以完全通关。
所以说,未来的 AI 白热化竞争一定是在专家数据赛道里,光靠白嫖海量互联网普通数据肯定不够了。所以像 OpenLedger 研发的数据归属权(Data Attribution)系统会成为新的基建。
想象一下吧,珍贵数据之所以珍贵,不仅仅是因为它稀缺,更是因为它能给数据的持有者带来回报(如果你把数据视作为一种资产的话),就像房子会产生房租,数据也应该产生数据租。
Ram 在视频里说,Hugging Face 很伟大,但上面 90% 的数据集对商业落地来说没那么有用。
因此,想要可以商用的专家 AI,必须先有数据归属权系统,让珍贵数据的持有者把它的珍贵数据拿出来,并且让他获得回报尝到甜头,进而鼓励更多的珍贵数据持有者拿出来,形成正循环。
AI 带来的平权可能就隐藏在此,过去专家的资源是宝贵的,是特权阶级特有的,毕竟是专家的时间有限。而 AI 时代,如果是专家 AI 呢?它极大降低了边际成本,让普通人使用专家级或者准专家级的服务成为可能。
期待 OL 主网上线。



8月5日 14:11
.@TrustWallet 现在是 @OpenLedgerHQ 的客户,正式使用我们的技术进行构建。
自豪地支持 Web3 最受信任的钱包之一,因为它拥抱可验证的 AI。
听 @Ramkumartweet 和 @EowynChen 在 @therollupco 上详细讲解。
5.06K
热门
排行
收藏