资讯

近期,LMArena更新了大型语言模型的排名,引发了一场关于me ta最新发布的开源大模型Llama-4-Maverick真实性能的广泛讨论。此前,Llama-4-Maverick在LMArena的Chatbot Arena ...
IT之家 4 月 14 日消息,LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名,其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 Meta 为刷榜向 LMArena ...
近日,Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名,这一剧烈波动引发了开发者们的广泛质疑,认为 Meta 可能通过提交 特供 版本以刷榜。事情的起因要追溯到4月6日,Meta ...
根据泄露的信息,Meta的高管们,甚至是相关职员,操作的方式让人匪夷所思:在后训练阶段竟建议将多个benchmark测试集混入训练数据,似乎是在寻求能够短期提升某些指标的效果以瑕掩瑜。这种做法引发了这位内部员工的强烈反对,并在辞职信中明确要求不要在技术报告中挂名。试想,这样的悲剧在一个技术公司中是多么的尴尬和讽刺。
4月6日,Meta发布了 最新 的大模型Llama 4,包含Scout、Maverick和Behemoth三个版本。其中,Llama-4-Maverick在LMArena公布的Chatbot Arena LLM 排行榜中的排名第二,仅次于Gemini ...
Meta 公司上周发布了一款名为 Maverick 的新旗舰 AI 模型,并在 LM Arena 测试中取得了第二名的成绩。然而,这一成绩的含金量却引发了诸多质疑。据多位 AI 研究人员在社交平台 X 上指出,Meta 在 LM Arena 上部署的 ...
我们注意到社区对Llama-4最新版本在Arena平台的发布存在疑问。为确保完全透明,现公开2000余组模型对战数据供公众审阅,包含用户提示词、模型回复及用户偏好数据(链接详见下一条推文)。
IT之家 4 月 14 日消息,LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名,其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 ...
机器之心报道机器之心编辑部Meta 翻车来得猝不及防。上周六,Meta 发布了最新 AI 模型系列 ——Llama 4,并一口气出了三个款,分别是 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 ...
研究人员进一步发现,公开可下载的Maverick版本与LM Arena上托管的模型在行为上存在显著差异。例如,LM Arena版本更倾向于使用大量表情符号,且回答往往冗长。这种行为差异不仅让开发者难以准确评估模型的实际性能,还具有一定的误导性。
人人都是产品经理 on MSN4 天
Llama 4出来,Meta 马斯克遇到了大麻烦。
Meta最近推出了其最新的AI模型系列Llama 4,声称在多模态功能和性能上取得了显著进步。然而,这一发布却引发了广泛的争议和批评。 Meta 最近推出了其最新的 AI 模型系列 Llama 4,据称引入了多模态功能的进步和… Meta ...
4】Meta公司在4月5日发布了其大型语言模型Llama的最新版本Llama 4 Scout与Llama 4 Maverick。Meta在声明中表示,Llama 4是一个多模态AI系统,能够处理和整合文本、视频、图像、音频等多种数据类型,并能在不同格式之间实现内容转换。据介绍,Scout和Maverick是该公司首款采用混合专家架构(MoE)的模型,两者均以开源形式发布。此外,Meta还预告了Ll ...