跳轉至主要內容
行情
掃鏈
追蹤
信號
牛人榜
兌換
資產
邀請計劃
更多
產品
DeFi
市場
洞察中心
Eco Hub
安全中心
開發者中心
X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
Wallet API
探索 Wallet API
API 文檔
API Key 管理
區塊鏈瀏覽器
DApp 連接錢包
Boost
X Launch
參與 X Launch,搶先賺新幣
Giveaway
完成指定任務,領取空投好禮
交易賽
交易熱門代幣,衝榜贏大獎
獎勵中心
領取獎勵和空投
預警
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
學院
幫助中心
發現功能使用指南
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+1.82%
USELESS
-5.8%
IKUN
+2.25%
gib
+0.45%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
-2.31%
ALON
+1.09%
LAUNCHCOIN
+1.82%
GOONC
+1.41%
KLED
+3.89%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
-0.37%
Boopa
+2.18%
PORK
+1.11%
主頁
Séb Krier
🪼 AGI 政策開發和戰略@GoogleDeepMind |雷基德癮君子、次元滑翔機、深處 ArXiv 居民、星際逃亡者、不確定 | 🛸
查看原文
Séb Krier
6 小時前
有趣的是,危險能力評估的想法最初是在一個公共評論主要集中於隨機鸚鵡和「AI無法生成手指,那它怎麼可能成為超越偏見的威脅?」的背景下產生的。 因此,建立有害用途的玩具版本以更好地傳達可能性是非常合理的,特別是考慮到安全專家正確的直覺,即進展不會止步於此:即使AI失敗,顯示它們隨著時間的推移變得更好也很容易。 問題是這樣做有點過於成功,人們忘記了評估的「玩具版本」部分,媒體報導「勒索」或模型在基本病毒學多選題中表現良好或生成基本的惡意代碼作為重大事件——其實並不是。 但當然,許多倡導者喜歡利用它們來說明為什麼比以往任何時候都更需要監管,或誇大事情的嚴重性(「這很好」的迷因等)。人們對「危險模型」做出了可疑的聲明,這是由該領域特有的深度風險厭惡所驅動。 自那時以來,該領域已經成熟,評估看起來更好,部分原因是安全方面必須實際與生物或網絡領域的專家接觸,而不是試圖從第一原則出發解決所有問題。儘管我仍然覺得許多評估基本、靜態且不具外部有效性——但它們仍然是重要的指標。 但具體的威脅模型仍在辯論中,AI是否會實質性改變網絡安全中的攻防平衡仍然是一個未解的問題。 最近的Anthropic報告是很好的工作,但似乎並不是一個重大事件,因為這類攻擊相當常見;當然,涉及更多自動化,這應該被研究,但這在某種程度的擴散下顯然是必然的。 你應該預期壞人也會使用技術。我們應該關注的是這是否正在創造逐漸的不對稱,並顯著增加損害/成本/贖金,以及網絡防禦/關鍵基礎設施在此過程中得到加強的程度。依我看,我們應該有偏向於「混亂均衡」而非「單邊攻擊優勢」的先驗。
11.11K
33
Séb Krier
22 小時前
AGI 研究者展現出經濟理解的「火花」,新論文聲稱。這一群體對激勵和市場的理解超過了以往的 AI 研究者,但仍然遠低於大學本科水平。
25.77K
314
Séb Krier
11月12日 06:43
專家或學者能夠清晰表達自己,並願意善意地解釋非專家的合理異議,這是一件非常特別的事情。然而,有時你得到的卻是一種把關的形式,帶著一點傲慢——這種傲慢是建立在AI正在幫助打破的虛幻舒適感之上。如果你更重視作為專家的地位,而不是實際推進理解/知識,那麼AI的進步就是壞消息。
5.49K
84
熱門
排行
收藏