资讯

微软研究团队建立了一个“AI适用度得分”(AI Applicability Score),结合使用频率、成功率以及AI能完成任务的程度,来衡量各职业受AI影响的强弱。 图注:这图告诉我们:哪些工作任务在现实工作中很常见、用户最关注、以及AI最常帮忙的 ...
加州大学伯克利分校副教授,Physical Intelligence 的联合创始人,强化学习领域大牛 Sergey Levine ...
除了「删库」危机以外,Jason 还反复提及了 Replit 无法实现「代码冻结」的功能缺陷,其无法冻结部分代码免于修改,这给实际的应用带来了非常大的困扰。 Replit ...
今年,夺下IMO金牌虽然完全基于Gemini自然语言能力,但团队也在AlphaGeometry和AlphaProof等形式化系统方面也取得了持续的进展。 谷歌坚信,那些能够将流畅的自然语言能力与严谨的推理能力(包括形式化语言中的可验证推理)相结合的AI智能体,将成为数学家、科学家、工程师和研究人员不可或缺的工具。
GPT-5要上线的消息,已经传得满天飞了!有说两周内上线的,有说它是一个路由器的。同时还有更多猛料:GPT-6,已经在训练中了。莫非OpenAI那些拒掉3亿天价offer的10个人,真的看到了什么不得了的东西?
在「Circle Packing」问题上,这个少年的算法以「0.00006442」的优势超过了谷歌AlphaEvolve,也超过了此前的FICO Xpress创造的纪录。 FICO(Fair Isaac Corporation)是一个专注于数据分析和决策管理的美国公司,最著名的产品是FICO信用评分,广泛用于信贷行业评估个人的信用风险。
尽管 Cursor 自 4 月以来收入激增 2 亿美元,需求明显,但他们能否在 OpenAI、Google 等巨头竞逐 AI 编码市场时保持优势?当基础功能都频繁崩溃,昂贵的价格又如何自圆其说?
南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界模型WORLDMEM。 目前,世界模型的模拟方法在维持长期一致性方面仍面临巨大挑战。许多模拟环境在视角移动或时间推移后会出现内容变化,导致 3D 空间不一致,严重影响了用户体验和模拟效果的可靠性。 为了解决这一难题,南洋理工大学、北京大学王选计算机技术研究所、上海人工智能实验室的研究人员联合开源了长记忆世界 ...
为了严谨地研究多任务预训练的影响,论文在近 1,700 小时的机器人数据上训练了一系列基于扩散的 LBM,并进行了 1,800 次真实世界的评估部署和超过 47,000 次模拟部署,以严格研究它们的能力。
OpenAI的神秘模型o3-alpha意外曝光,其强大的代码能力碾压众多AI。该模型疑似在东京AtCoder世界编程大赛2025中夺得亚军,最终不敌人类选手Psyho。 OpenAI果然藏了一手。
OpenAI又抢了谷歌风头!AI模型最先拿下IMO金牌的头魁原来是谷歌DeepMind,只是因为内部流程审批慢,被OpenAI抢占先机,占尽风头。那助OpenAI拿下IMO金牌的模型有何特殊之处?它背后的争议为何引发菲尔兹奖得主陶哲轩公开出面发声?
尽管多模态大模型在数学、科学等结构化任务中取得了长足进步,但在需要灵活解读视觉信息的通用场景下,其性能提升瓶颈依然显著。现有模型普遍依赖基于知识的思维模式,却缺乏对视觉线索的深度校验与再思考能力,导致在复杂场景下频繁出错。