Zero Zero - 搜索 News

知乎 on MSN1 小时

如何评价 DeepSeek 的 R1 与 R1-Zero 模型？

过去一周，我收到了好多关于DeepSeek新出的R1模型的询问，特别关于他们的强化学习（RL）方法。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果