扫了下paper, 简单写下...... 他们列了A800、H800, 华子的npu, 还有两个100多T算力不知道是哪家的 首先他们在这些device集群上做训练, 需要解决稳定性、性能、loss对齐问题 他们开发DLRover、Diagnose ...