Deepseek Benchmark - 搜索 News

8 小时

近日，Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。在过去的几周里，研究人员推出了许多改进推理的新策略，包括扩展简单测试 - 时间规模化（S1）、关联思维链（Chain of Associated ...

10 小时

根据AI大模型测算美腾科技后市走势。短期趋势看，连续3日被主力资金减仓。主力没有控盘。中期趋势方面，上方有一定套牢筹码积压。近期筹码减仓，但减仓程度减缓。舆情分析来看，目前市场情绪极度悲观。

当然我们在本地部署的DeepSeek只能是蒸馏版，因为满血版DeepSeek-R1模型高达671b的参数根本不是小飞机平台所能容纳的，好在还有六个蒸馏后不同规模的小模型，方便玩家根据自己的硬件配置选择合适的模型规模。

什么值得买社区频道 on MSN1 天

随着AMD在DIY市场上的强势崛起和Intel的逐渐式微，再加以DeepSeek为代表兴起的AI热潮，DDR5内存市场的选购方向悄然发生了改变。从过去一味冲击高频，逐渐转向高频率兼顾低时序和大容量的方向转变。

小黑盒数码硬件 on MSN1 天

【本文由小黑盒作者@real川川川川桑于03月31日发布，未经许可不得转载！】低预算用户装机绕不过的问题，就是如何选择一张合适的显卡，特别是百元价位的亮机卡，买二手怕翻车，买全新则是怕性能不够，很容易陷入长时间纠结。

2 天

从技术角度来看，混元T1正式版沿用了混元Turbo S的创新架构，采用 Hybrid-Mamba-Transformer融合模式，这也是工业界首次将混合Mamba架构无损应用于超大型推理模型。这一架构能降低传统Transformer架构的计算复杂度 ...

在论文发布的版本里，作者评测了包括 GPT-4o，Claude-35-Sonnet, Gemini-1.5-pro-preview 等17个当时最领先的 LLM，每两个模型在每个游戏上进行20轮相互对抗赛（10 轮先手 10 ...

3 天

【新智元导读】AI频频刷新基准测试纪录，却算不清「strawberry」里到底有几个字母r，在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起，例如由一名高中生开发的MC-Bench，用Minecraft方块「竞技场」模式评价AI能力。这种新 ...

4 天

日前，工业和信息化部正式发布2024年未来产业创新发展优秀典型案例名单，三六零集团 (以下简称“360”)自主研发的大模型安全护栏产品解决方案 ...

4 天

日前，工业和信息化部正式发布2024年未来产业创新发展优秀典型案例名单，三六零集团（以下简称“360”）自主研发的大模型安全护栏产品解决方案（360“智盾”）成功入选，成为人工智能安全领域标志性产品。

4 天

阿里凌晨三点发布新的视觉推理模型QVQ-Max,max,推理,凌晨三点,视觉,qvq ...

一些您可能无法访问的结果已被隐去。