2B小姐姐壁纸 - 搜索 News

36氪27 天

全球首次，2B复现DeepSeek-R1“啊哈时刻”，UCLA等用纯RL实现多模态推理

就在刚刚，我们在未经监督微调的2B模型上，见证了基于DeepSeek-R1-Zero方法的视觉推理「啊哈时刻」！这一成就，再次让AI社区轰动。博客地址 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果