在开放AGI研讨会上,@zihan_johan_liu,@nvidia的高级研究科学家,介绍了AceReason-Nemotron:一种基于强化学习的方法,用于推动竞争编程中的数学和代码推理。 完整视频 👉
160