利用电路追踪方法,团队对Claude 3.5 Haiku在长逻辑推理、多语言、长期规划等任务场景的工作过程进行了观察,发现了其中许多特点: 在多语言场景中,作者研究了模型对 “the opposite of ‘small’” 的不同语言版本(英语、法语、中文)的处理,发现模型处理这些提示的电路相似,包含共享的多语言组件和特定语言组件。
Lars Moravy表示,Cybercab的生产设备已经在得克萨斯州的Giga ...