跳转至主要内容
行情
扫链
追踪
信号
牛人榜
兑换
资产
邀请计划
更多
产品
DeFi
市场
洞察中心
Eco Hub
安全中心
开发者中心
X Layer
探索 X Layer
X Layer 浏览器
跨链桥
开发者文档
测试网水龙头
GitHub
Wallet API
探索 Wallet API
API 文档
API Key 管理
区块链浏览器
DApp 连接钱包
Boost
X Launch
参与 X Launch,抢先赚新币
Giveaway
完成指定任务,领取空投好礼
交易赛
交易热门代币,冲榜赢大奖
奖励中心
领取奖励和空投
预警
语言
货币
下载 OKX Wallet
Web3 指南
公告
返回
简体中文
繁體中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
学院
帮助中心
发现功能使用指南
热门话题
#
Bonk 生态迷因币展现强韧势头
Hosico
+1.82%
USELESS
-5.8%
IKUN
+2.25%
gib
+0.45%
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
Bonk
-2.31%
ALON
+1.09%
LAUNCHCOIN
+1.82%
GOONC
+1.41%
KLED
+3.89%
#
Solana 新代币发射平台 Boop.Fun 风头正劲
BOOP
-0.37%
Boopa
+2.18%
PORK
+1.11%
主页
Séb Krier
🪼 AGI 策略开发和战略@GoogleDeepMind |Rekkid 瘾君子、次元滑翔机、ArXiv 深处居民、星际逃亡者、不确定 | 🛸
查看原文
Séb Krier
6 小时前
有趣的是,危险能力评估的想法最初是在一个公众评论主要围绕随机鹦鹉和“AI无法生成手指,它怎么可能超越偏见成为威胁?”的背景下产生的。 因此,构建有害用途的玩具版本以更好地传达可能性是非常合理的,特别是考虑到安全领域的专家们正确的直觉,即进展不会止步于此:即使AI失败,展示它们随着时间的推移变得更好也很容易。 问题在于,这种做法有点过于成功,人们忘记了评估的“玩具版本”部分,媒体报道“勒索”或模型在基本病毒学多项选择题中表现良好,或生成基本恶意软件代码作为重大事件——其实并不是。 但当然,许多倡导者喜欢利用这些来说明为什么比以往任何时候都更需要监管,或者夸大事情的严重性(“这没问题”表情包等)。人们对“危险模型”做出了可疑的声明,这种声明是由该领域特有的深度风险厌恶所推动的。 自那时以来,该领域已经成熟,评估看起来更好,部分原因是安全方面必须真正与生物或网络领域的专家进行接触,而不是试图从第一原理出发解决所有问题。尽管我仍然发现许多评估是基本的、静态的,并且不具外部有效性——但它们仍然是重要的指标。 但具体的威胁模型仍在辩论中,AI是否会在网络安全中实质性地改变攻防平衡仍然是一个悬而未决的问题。 最近的Anthropic报告是很好的工作,但似乎并不是一件大事,因为这些类型的攻击相当常见;当然,涉及更多的自动化,这应该被研究,但仅此一点显然在某个扩散水平上就会是这样。 你应该预期坏人也会使用技术。我们应该关注的是,这是否正在造成逐渐的不对称,并显著增加损害/成本/赎金,以及网络防御/关键基础设施在此过程中得到加强的程度。依我看,我们应该有倾向于“混乱均衡”而非“单边攻击优势”的先验。
11.11K
33
Séb Krier
22 小时前
AGI 研究人员展现出对经济理解的“火花”,一篇新论文声称。该群体对激励和市场的理解超过了以往的 AI 研究人员,但仍远低于本科生水平。
25.77K
314
Séb Krier
11月12日 06:43
能够清晰表达自己并愿意善意解读非专家的合理异议的专家或学者,确实是非常特别的。然而,有时你得到的却是一种把关的形式,带着一点傲慢——这种傲慢是建立在AI正在帮助打破的虚幻舒适感之上的。如果你更看重作为专家的地位而不是实际推动理解/知识的进步,那么AI的进步就是坏消息。
5.49K
84
热门
排行
收藏