llama 4 maverick - 搜索 News

资讯

6 天on MSN

Meta开源大模型Llama-4-Maverick排名大跳水，被指刷榜作弊？

近期，LMArena更新了大型语言模型的排名，引发了一场关于me ta最新发布的开源大模型Llama-4-Maverick真实性能的广泛讨论。此前，Llama-4-Maverick在LMArena的Chatbot Arena ...

腾讯网6 天

Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌

IT之家 4 月 14 日消息，LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名，其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 Meta 为刷榜向 LMArena ...

6 天

Meta 新模型 Llama-4-Maverick 排名骤降，引发刷榜质疑

近日，Meta 公司发布的开源大模型 Llama-4-Maverick 在 LMArena 的排行榜上从第二名直降至第32名，这一剧烈波动引发了开发者们的广泛质疑，认为 Meta 可能通过提交特供版本以刷榜。事情的起因要追溯到4月6日，Meta ...

23 小时

Llama 4训练作弊爆出惊天丑闻！AI大佬愤而辞职，代码实测崩盘全网炸锅

根据泄露的信息，Meta的高管们，甚至是相关职员，操作的方式让人匪夷所思：在后训练阶段竟建议将多个benchmark测试集混入训练数据，似乎是在寻求能够短期提升某些指标的效果以瑕掩瑜。这种做法引发了这位内部员工的强烈反对，并在辞职信中明确要求不要在技术报告中挂名。试想，这样的悲剧在一个技术公司中是多么的尴尬和讽刺。

7 天

实锤了，Llama 4重测排名掉至32名！远不及DeepSeek和Qwen

4月6日，Meta发布了最新的大模型Llama 4，包含Scout、Maverick和Behemoth三个版本。其中，Llama-4-Maverick在LMArena公布的Chatbot Arena LLM 排行榜中的排名第二，仅次于Gemini ...

13 天

Meta 新旗舰 AI 模型 Llama 4 Maverick 测试成绩遭质疑，被指针对性优化

Meta 公司上周发布了一款名为 Maverick 的新旗舰 AI 模型，并在 LM Arena 测试中取得了第二名的成绩。然而，这一成绩的含金量却引发了诸多质疑。据多位 AI 研究人员在社交平台 X 上指出，Meta 在 LM Arena 上部署的 ...

腾讯网12 天

Llama 4遭竞技场背刺！实锤用特供版刷榜，2000+对战记录公开

我们注意到社区对Llama-4最新版本在Arena平台的发布存在疑问。为确保完全透明，现公开2000余组模型对战数据供公众审阅，包含用户提示词、模型回复及用户偏好数据（链接详见下一条推文）。

新浪网5 天

Meta 开源大模型 Llama-4-Maverick 基准测试排名暴跌

IT之家 4 月 14 日消息，LMArena 更新了 Meta 最新发布的开源大模型 Llama-4-Maverick 的排名，其从此前的第 2 名直线下降至第 32 名。这证实了此前开发者对 ...

腾讯网13 天

Meta Llama 4被疑考试「作弊」：在竞技场刷高分，但实战中频频翻车

机器之心报道机器之心编辑部Meta 翻车来得猝不及防。上周六，Meta 发布了最新 AI 模型系列 ——Llama 4，并一口气出了三个款，分别是 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 ...

13 天

Meta Llama 4 Maverick测试成绩真实性引争议，版本不一致成焦点

研究人员进一步发现，公开可下载的Maverick版本与LM Arena上托管的模型在行为上存在显著差异。例如，LM Arena版本更倾向于使用大量表情符号，且回答往往冗长。这种行为差异不仅让开发者难以准确评估模型的实际性能，还具有一定的误导性。

人人都是产品经理 on MSN4 天

Llama 4出来，Meta 马斯克遇到了大麻烦。

Meta最近推出了其最新的AI模型系列Llama 4，声称在多模态功能和性能上取得了显著进步。然而，这一发布却引发了广泛的争议和批评。 Meta 最近推出了其最新的 AI 模型系列 Llama 4，据称引入了多模态功能的进步和… Meta ...

8 小时

【Meta发布最新AI大模型Llama

4】Meta公司在4月5日发布了其大型语言模型Llama的最新版本Llama 4 Scout与Llama 4 Maverick。Meta在声明中表示，Llama 4是一个多模态AI系统，能够处理和整合文本、视频、图像、音频等多种数据类型，并能在不同格式之间实现内容转换。据介绍，Scout和Maverick是该公司首款采用混合专家架构(MoE)的模型，两者均以开源形式发布。此外，Meta还预告了Ll ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果