熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
1/ 特定於代碼庫的 RL 能否推動代碼 LLM 的前沿?
在 @cgftlabs,我們幫助客戶在其內部代碼庫上對 Qwen-2.5-7B 進行了 RL 調整,以創建單元測試,並使用覆蓋率引導的 GRPO。結果?它擊敗了 o4-mini 和 o3。這是它的工作原理(連結到簡歷中的完整博客) 🧵

7.88K
熱門
排行
收藏