Deepseek Benchmark - 搜索 News

17 小时

本周五提交的一项工作中，来自 DeepSeek、清华大学的研究人员探索了奖励模型（RM）的不同方法，发现逐点生成奖励模型（GRM）可以统一纯语言表示中单个、成对和多个响应的评分，从而克服了挑战。研究者探索了某些原则可以指导 GRM ...

机器之心报道机器之心编辑部一种全新的学习方法。这会是 DeepSeek R2 的雏形吗？本周五，DeepSeek 提交到 arXiv 上的最新论文正在 AI 社区逐渐升温。当前，强化学习（RL）已广泛应用于大语言模型（LLM）的后期训练。最近 RL ...

3 天

DeepSeek-R1之后推理模型发展如何？Raschka长文梳理后R1时代14篇重要论文

近日，Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。在过去的几周里，研究人员推出了许多改进推理的新策略，包括扩展简单测试 - 时间规模化（S1）、关联思维链（Chain of Associated ...

腾讯网4 天

DeepSeek R1本地训练全流程实操指南，手把手教你打通其“任督二脉”

作者：asher在人工智能的浪潮中，DeepSeek R1 凭借其卓越的性能与潜力，成为众多开发者和研究人员眼中的 ...

4 天

高中生用「我的世界」评测SOTA模型！Claude暂时领先，DeepSeek紧随其后

AI频频刷新基准测试纪录，却算不清「strawberry」里到底有几个字母r，在人类看来很简单的问题却频频出错。这种反差促使创意测评兴起，例如由一名高中生开发的MC-Bench，用Minecraft方块「竞技场」模式评价AI能力。这种新的测评范式，或 ...

9 天

DeepSeek V3小版本升级：人工智能新突破的曙光

近日，DeepSeek V3的“小版本升级”引起了业界的热烈关注。这一升级不仅在性能上实现了显著提升，还为人工智能领域的深度学习技术带来了新的曙光。随着相关技术的不断进步，用户对于智能助手的期待自然也水涨船高。DeepSeek V3的优化恰好满足了这一需求，使得这一大语言模型在推理、前端开发及中文写作等多个领域展现出更为强大的能力。

10 天on MSN

DeepSeek-V3-0324版发布代码生成能力大幅提升

3月24日，DeepSeek发布了其V3模型的更新版本，版本号为DeepSeek-V3-0324。这一版本的更新标志着AI编程领域迈出了重要的一步，被认为开启了AI编程的全民普惠时代。DeepSeek-V3的发布，无疑是AI编程领域的一个重要里程碑， ...

腾讯网13 天

腾讯混元T1正式版发布：实战不输DeepSeek-R1，输出价格便宜3/4

智东西3月22日报道，昨夜，腾讯正式将混元大模型系列的深度思考模型升级为混元-T1正式版。 T1是腾讯自研的强推理模型，吐字速度达到60~80token/s，在实际生成效果表现中远快于DeepSeek-R1。

腾讯网28 天

“3万张卡”、60亿投入后，DeepSeek发了5000亿红包

芯事重重“算力经济学”系列研究，聚焦有关算力、成本相关话题的技术分析、产业穿透，本期聚焦DeepSeek的用户现状、算力储备、资本支出和产业影响。 DeepSeek在春节期间的惊艳表现，成为中、美科技竞争的新变量。在技术方面，DeepSeek成功地摸索出了一套在 ...

爱范儿1 个月

百度文库、网盘接入 DeepSeek，这才是学生党真正想要的 AI

使用微信扫码将网页分享到微信又一个「DeepSeek 王炸组合」，来了。2 月 28 日，两个国民级应用，百度文库和百度网盘，全量接入了 DeepSeek-R1 满血版。

第一财经24 天

DeepSeek在ESG实践中的问题分析

通过专业机构以DeepSeek为基础进行ESG垂直模型的训练，是DeepSeek应用于ESG领域更为高效的路径。近日，火热的DeepSeek在各行各业中得到了广泛应用 ...

华尔街日报中文版9 天

DeepSeek发布更新版大语言模型，称其推理能力更强

DeepSeek宣布了DeepSeek V3-0324更新，称较上一版本有“显著的改进”，包括更好的推理、网络开发和搜索能力。中国人工智能(AI)初创公司DeepSeek发布了其大语言模型的更新版，称后者具备更强的推理能力。几个月前，这家公司推出一款旨在与OpenAI模型竞争的低成本 ...

当前正在显示可能无法访问的结果。

隐藏无法访问的结果