Deepseek V3 Hugging Face

22 分钟

Meta 深夜开源 Llama 4：首次采用 MoE 架构，千万 Token 上下文刷新纪录

Meta 深夜开源 Llama 4：首次采用 MoE 架构，千万 Token 上下文刷新纪录,上下文,meta,token ...

腾讯网3 小时

刚刚，Llama 4深夜开源击败DeepSeek V3！2万亿多模态巨兽抢回王座

新智元报道编辑：编辑部 JNY【新智元导读】原生多模态Llama 4终于问世，开源王座一夜易主！首批共有两款模型Scout和Maverick，前者业界首款支持1000万上下文单H100可跑，后者更是一举击败了DeepSeek ...

3 小时on MSN

Meta重磅推出Llama 4系列AI模型，性能跃升引关注

在科技界的一次重大突破中，meta公司于周末震撼发布了其Llama系列中的最新成员——Llama 4。此次发布标志着meta在人工智能领域的又一里程碑。 Llama 4系列共推出了三款新模型，分别是Llama 4 Scout、Llama 4 Maverick以及仍在训练中的Llama 4 ...

18 小时

杭州“霸榜”全球开源模型通义千问斩获总榜第一

据国是直通车，4月5日消息，全球最大的AI开源社区Hugging Face更新了大模型榜单，阿里通义千问近期开源的端到端全模态大模型Qwen2.5-Omni登上总榜榜首，DeepSeek-V3-0324和openfree/flux-chatgpt排名第三，此前群核科技的SpatialLM-Llama-1B也在榜上，杭州或成大模型开源之都。

杭州网科技频道3 天

杭州科技企业为何集体押注大模型开源？

如今，杭州已经成了全球范围内少有的，同时拥有3个世界顶级开源模型的城市。在达摩院首席科学家赵德丽看来，大模型开源是杭州从这一轮AI技术变革浪潮中脱颖而出的关键，“3年时间，杭州用别人几乎十分之一的算力成本，跑出了10倍的模型迭代速度。” ...

南方财经网3 天

新鲜早科技丨网友曝小米车主驾驶中睡着；李想呼吁统一智能驾驶的 ...

网友曝小米车主驾驶中睡着，小米客服回应：智驾系统只是辅助驾驶，必要时需人工接管。

3 天

DeepSeek-V3击败R1开源登顶！杭州黑马撼动硅谷AI霸主，抹去1万亿市值神话

DeepSeek-V3-0324这波进化，实属有亿点点厉害。目前在榜单排行中，它的实力与Gemini 2.0 Pro、GPT-4.5 preview、Gemini 2.0 Flash Thinking并驾齐驱。也就是说，当前闭源模型最强三款——Gemini 2.5 Pro、GROK 3、GPT-4o之后，开源模型之光便是DeepSeek-V3了！

界面新闻 on MSN3 天

阿里通义千问站上全球开源模型榜首

阿里通义千问站上全球开源模型榜首 4月2日，全球最大的AI开源社区Hugging ...

腾讯网3 天

阿里通义千问站上全球开源模型榜首，杭州公司包揽前三

4月2日，全球最大的AI开源社区Hugging Face更新大模型榜单，阿里通义千问的端到端全模态大模型Qwen2.5-Omni占据榜首，DeepSeek-V3-0324和群核的SpatialLM-Llama-1B紧随其后，杭州公司包揽全球开源模型榜单前三。

3 天

阿里通义千问登顶全球开源模型总榜杭州公司霸榜前三

4月2日，全球最大的AI开源社区Hugging Face更新了大模型榜单，阿里通义千问近期开源的端到端全模态大模型Qwen2.5-Omni登上总榜榜首，DeepSeek-V3-0324和群核的SpatialLM-Llama-1B紧随其后，杭州公司霸榜全球开源模型榜单前三。

电脑商情在线5 天

DeepSeek 大语言模型做了哪些创新？

DeepSeek 在 12 月底和 1 月底分别发布了两个模型：DeepSeek - V3，一个与 GPT-4 规模相当的强大基础模型；以及 DeepSeek R1，一个专门用于复杂推理的模型，基于 V3 基础构建。以下是每个模型的技术策略概述。

5 天

正在和DeepSeek-V3-0324做个大项目，「氛围编程」简直太疯狂了

接着我们又输入：「编码一只骑自行车的鹈鹕，SVG。」后来因为轮子不转，我们又通过对话提示 AI，鹈鹕的脚应该和轮子联动，脚应该放在踏板上。结果，脚确实放在踏板上了，轮子也转了，而且可以调速度。但是，这个鹈鹕的位置还是很奇怪。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果