site:www.51cto.com - 搜索 News

资讯

12 小时

微软研究团队建立了一个“AI适用度得分”（AI Applicability Score），结合使用频率、成功率以及AI能完成任务的程度，来衡量各职业受AI影响的强弱。图注：这图告诉我们：哪些工作任务在现实工作中很常见、用户最关注、以及AI最常帮忙的 ...

11 小时

关于机器人数据，强化学习大佬Sergey Levine刚刚写了篇好文章

加州大学伯克利分校副教授，Physical Intelligence 的联合创始人，强化学习领域大牛 Sergey Levine ...

16 小时

欺骗、隐瞒、删库跑路，AI程序员彻底失控翻车

除了「删库」危机以外，Jason 还反复提及了 Replit 无法实现「代码冻结」的功能缺陷，其无法冻结部分代码免于修改，这给实际的应用带来了非常大的困扰。 Replit ...

13 小时

全球首个IMO金牌AI诞生！谷歌Gemini碾碎奥数神话，拿下35分震惊裁判

今年，夺下IMO金牌虽然完全基于Gemini自然语言能力，但团队也在AlphaGeometry和AlphaProof等形式化系统方面也取得了持续的进展。谷歌坚信，那些能够将流畅的自然语言能力与严谨的推理能力（包括形式化语言中的可验证推理）相结合的AI智能体，将成为数学家、科学家、工程师和研究人员不可或缺的工具。

13 小时

GPT-5两周内发布，内测猛料流出？GPT-6或已开始训练，奥特曼剧透百万GPU

GPT-5要上线的消息，已经传得满天飞了！有说两周内上线的，有说它是一个路由器的。同时还有更多猛料：GPT-6，已经在训练中了。莫非OpenAI那些拒掉3亿天价offer的10个人，真的看到了什么不得了的东西？

13 小时

刷新世界纪录！神秘学生击败谷歌AlphaEvolve难题最优解，优势仅0.00006442

在「Circle Packing」问题上，这个少年的算法以「0.00006442」的优势超过了谷歌AlphaEvolve，也超过了此前的FICO Xpress创造的纪录。 FICO（Fair Isaac Corporation）是一个专注于数据分析和决策管理的美国公司，最著名的产品是FICO信用评分，广泛用于信贷行业评估个人的信用风险。

11 小时

Cursor 新定价方案引发用户强烈不满

尽管 Cursor 自 4 月以来收入激增 2 亿美元，需求明显，但他们能否在 OpenAI、Google 等巨头竞逐 AI 编码市场时保持优势？当基础功能都频繁崩溃，昂贵的价格又如何自圆其说？

13 小时

南洋理工、北大、上海AI实验室开源长记忆世界模型

南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界模型WORLDMEM。目前，世界模型的模拟方法在维持长期一致性方面仍面临巨大挑战。许多模拟环境在视角移动或时间推移后会出现内容变化，导致 3D 空间不一致，严重影响了用户体验和模拟效果的可靠性。为了解决这一难题，南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界 ...

1 天

机器人的「GPT时刻」来了？丰田研究院悄悄做了一场最严谨的VLA验证 ...

为了严谨地研究多任务预训练的影响，论文在近 1,700 小时的机器人数据上训练了一系列基于扩散的 LBM，并进行了 1,800 次真实世界的评估部署和超过 47,000 次模拟部署，以严格研究它们的能力。

1 天

代码碾压一切！OpenAI神秘模型o3-alpha一夜刷屏，却遭41岁大神绝地反杀

OpenAI的神秘模型o3-alpha意外曝光，其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军，最终不敌人类选手Psyho。 OpenAI果然藏了一手。

1 天

一盘大棋！OpenAI「截胡」IMO金牌，奥特曼为GPT-5献上「核弹级」预热

OpenAI又抢了谷歌风头！AI模型最先拿下IMO金牌的头魁原来是谷歌DeepMind，只是因为内部流程审批慢，被OpenAI抢占先机，占尽风头。那助OpenAI拿下IMO金牌的模型有何特殊之处？它背后的争议为何引发菲尔兹奖得主陶哲轩公开出面发声？

1 天

超越O4-mini，多模态大模型终于学会回头「看」：中科院自动化所提出 ...

尽管多模态大模型在数学、科学等结构化任务中取得了长足进步，但在需要灵活解读视觉信息的通用场景下，其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式，却缺乏对视觉线索的深度校验与再思考能力，导致在复杂场景下频繁出错。

当前正在显示可能无法访问的结果。

隐藏无法访问的结果