资讯

整理 I 褚杏娟当地时间 4 月 8 日,英伟达宣布推出其最新大语言模型 Llama3.1 Nemotron Ultra 253B。该模型基于 Meta 的 Llama-3.1-405B-Instruct ...
帖主进一步解释说,Llama 4 发布之后,实测结果遭到 X 和 Reddit 网友的吐槽。作为一名目前也在学术界的人他宣称实在无法接受 Meta 的做法,已提交离职申请,并明确要求在 Llama 4 的 Technical Report ...
然而,AI 一日,人间一年,在 Llama 4 遭遇「滑铁卢」的评论区中,其他开源模型的好评随处可见。其中,Google Gemma 以轻量高效和多模态能力赢得广泛认可,阿里的 Qwen 系列基座模型崭露头角,而 DeepSeek ...
Meta发布新一代多模态模型Llama 4系列,并导入WhatsApp、Messenger、Instagram及网页版的Meta AI助理。 已有2款新模型可从llama.com或Hugging Face下载,分别是Llama 4 ...
DeepSeek和清华大学的研究者提出一种自我原则点评调优(Self-Principled Critique Tuning, SPCT)的学习方法。同时提出了DeepSeek-GRM-27B,它是基于Gemma-2-27B经过SPCT后训练的。可以发现,SPCT显著提高了GRM的质量和可扩展性,在多个综合RM基准测试中优于现有方法和模型。 阳江三山岛海上风电柔直输电工程中标候选人公示 4月3日,中 ...
【新智元导读】Llama 4家族周末突袭,实属意外。这场AI领域的「闪电战」不仅带来了两款全新架构的开源模型,更揭示了一个惊人事实:苹果Mac设备或将成为部署大型AI模型的「性价比之王」。
刚刚过去的三月,人工智能的功能升级可谓一个爆款接着又一个爆款,无论是面向本地部署的Gemma,还是ChatGPT在社交媒体平台上掀起的日式动漫风。假如说以前的人工智能领域还是每年春节一爆款的话,这次则是直接开启了“疯狂三月”。
还有很多这些此前普通人想都不敢想的场景。看到如此火爆,谷歌CEO 劈查伊兴奋的发帖道:Gemini2.5 Pro是我们在众多基准测试中最先进的模型+SOTA(世界领先的模型),现在每个人都可以在Geimi中使用Canvas,快来尝试!
虽然生成式人工智能(以下简称GenAI)尚处于产业变革的初期阶段,美国旧金山湾区已成为排名第一的科创中心,该区域的GenAI独角兽市值占美国的81%。这与湾区当地科创产业密度正相关,正如纽约是互联网金融 (FinTech)与加密货币 ...
近日,谷歌宣布推出全新开源模型 TxGemma,专为提升治疗性药物的研发效率而设计。这一模型由谷歌 DeepMind 团队基于其先进的 Gemma ...
人人都是产品经理 on MSN10 天
大,就聪明吗?论模型的“尺寸虚胖”
本文深入探讨了模型参数与实际性能之间的关系,揭示了Dense和MoE架构的本质差异,以及它们在资源调度和计算效率上的不同表现。 你可能刷过这样的新闻: 一个只有 27B 参数的 Gemma-3,竟和 671B 参数 DeepSeek V3 ...
面对全球范围内日益增长的AI监管压力,谷歌正通过多种策略塑造公众认知和政策方向。公司高管强调,谷歌致力于通过教育项目培训劳动力,以适应AI技术的快速发展。谷歌首席执行官桑达尔皮查伊去年宣布投入1.2亿美元建设AI教育项目,旨在帮助更多人、组织和政府了解并使用AI工具,从而促进更好的政策制定和创造新机会。 谷歌的“Grow with Google”项目已帮助100万人完成课程,涵盖数据分析和IT支持 ...