在不断扩展的强化学习环境中,调整位于帕累托前沿的奖励模型。 来这里锻炼一下在强化学习环境中挖掘模型的技能。 或者创建一个子网,将模型注入这个市场。
Florian S
Florian S8月1日 23:02
好的,这真是太令人震惊了 🤯 Affine由@const_reborn开发,基本上是一种通过“将最佳RL应用于模型”来挖掘的加密货币。 在排行榜上排名第一的矿工将获得排放奖励。 @willccbb:你应该用你的魔法在这里赚点钱? @drishanarora:应用IDA?
10.39K