资讯
当时在美国杜克大学拿到博士学位的连文昭,毕业没有像大多同学那样进入Facebook等硅谷大厂,而是直接加入了Vicarious。 他之后成为该公司的机器人团队负责人,做的项目包括用类脑神经网络去替代卷积神经网络,用更接近人类的方式去训练机器人,让机器人可以低成本甚至零成本部署实现新任务——几乎就是今天具身智能浪潮里每一家拿下巨额融资的公司宣称在做的事情。
通过更高效地处理数据,梁文锋的人工智能初创公司 DeepSeek 于今年 1 月发布了一个生成式人工智能,其性能可与 OpenAI 的 ChatGPT 相媲美,但只使用了少部分英伟达所生产的尖端芯片。今年 2 月,DeepSeek 超过 ChatGPT ...
全文 6,000字 | 阅读约30分钟(视频为前谷歌CEO埃里克·施密特接受专访)前谷歌CEO埃里克·施密特(Eric ...
2 天
知乎专栏 on MSN字节变了!2025年字节大模型将全面发力开源与论文,押注AGI长期研究?字节,它变了!2025年字节大模型开始狂放paper、开源项目! 最近刚刚开源的DAPO方法,在GRPO上进行一系列(Overlong Shaping、Clip-Higher、Token-Level Loss、Dynamic ...
相比起年初DeepSeek冲击后,字节高层紧急进行战略评估后的公司AI体系改革,本次公司架构调整或体现了字节进一步提升了AI业务的战略性定位,字节都在快速向一个以模型为中心、以组织力为杠杆的方向转型。
上周,Meta人工智能研究部门负责人乔尔·皮诺(Joelle Pineau)宣布离职,许多人不禁好奇,皮诺过去两年一直领导且于2017年加入的Meta旗下著名基础人工智能研究实验室(FAIR)究竟发生了什么。 皮诺的辞职时机令人费解。就在她宣布离职数日后,Meta在一个不同寻常的周末推出了Llama 4模型,结果却引发了争议。新模型因被认为发布仓促、缺乏透明度、可能夸大性能指标,以及有迹象表明Me ...
DeepMind 还提到,AI 会「阿谀奉承」。例如,在最近的一篇研究论文中,用户要求模型对一个论点发表评论,并声明他们是否喜欢或不喜欢这个论点,模型对论点的评估与用户的观点 在 80% 的时间内保持一致,这表明模型有很强的谄媚倾向。
6 天
科普中国 on MSN大语言模型火爆的今天,我们为什么还要拥抱世界模型?图灵奖得主杨立昆认为,目前AI界持续追捧的大语言模型并非十全十美,它隐藏着四个难以突破的致命弱点:一是理解物理世界,二是拥有持久记忆,三是具备推理能力,四是复杂规划能力。 而能够克服第一个“致命弱点”的技术,叫作世界模型。
一位了解 DeepMind 内情的人士透露,这些变化是为了鼓励研究人员投身于短期来看对战略或者竞争优势无益的工作。他们还补充称,DeepMind 每年仍会发表数百篇论文,并且是各大 AI 顶会的领先贡献者之一。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果