近日,中国工程院院士 / 清华大学教授 / 博士生导师郑纬民确认出席 QCon 北京大会发表题为《 关于人工智能大模型的几点思考 》的主题演讲,并将分享 Kimi 幕后的大模型推理架构 Mooncake。
近日,中国工程院院士郑纬民教授在QCon北京大会上发表了题为《关于人工智能大模型的几点思考》的主题演讲,强调了人工智能领域正在经历的重大发展。这次演讲不仅带来了对大模型推理架构Mooncake的深入解析,也暴露了当前人工智能技术面临的一些紧迫挑战。随着2025年人工智能技术从单模态向多模态的飞速发展,要求更高的计算能力和存储需求也逐渐显现,这直接推动了各个行业对大模型的广泛应用。在这样的背景下,郑 ...
1、2024年9月23日互动易:公司2024年半年度算力网络业务收入2.25亿,同比增长32.82%。公司持续加大对算力业务的投入,打造国内领先的“算力集群技术服务专家”能力和国内规模领先的智算云服务。
4 天
重庆日报 on MSN运营商升级本地算力服务 助力渝企更快落地智能化应用在人工智能飞速发展的当下,算力资源成为推动各行各业数字化转型的关键动力。记者3月24日从重庆移动获悉,该公司依托DeepSeek大模型技术和本地化的算力资源池,已完成了DeepSeek全参数版本预置部署,本地算力服务得到全面升级。得益于此,重庆算力资 ...
4 天
人民网 on MSN重庆移动依托DeepSeek 全面升级本地算力服务在人工智能飞速发展的当下,算力资源成为推动各行各业数字化转型的关键动力。依托DeepSeek大模型技术和本地化的算力资源池,重庆移动完成了 DeepSeek全参数版本预置部署,正以全新姿态迎接智算时代。 双中心协同布局 算力性能卓越 ...
分析:存储阵列行业正在经历一场巨大的转型,朝着支持 AI 训练和推理的极致规模化和并行、多协议数据传输方向发展。双控制器阵列和横向扩展文件集群正逐渐成为过时的技术。 AI 训练的存储需求最初与以 DDN 的 ExaScaler 和 IBM 的 ...
【文/观察者网 熊超然】上个月,全球计算机存储领域的顶级学术会议——第23届USENIX文件与存储技术会议(USENIX Conference on File and Storage Technologies,简称FAST),在美国加利福尼亚州圣克拉拉举行。本届大会上,来自中国的人工智能(AI)初创公司月之暗面(Moonshot ...
其定位为“生产级大模型推理引擎”,提供如下特性: 多元算力适配:不仅支持 NVIDIA 最新旗舰到旧款的多系列产品 ... 官方表示,当前开源的赤兔引擎在部署 DeepSeek-R1-671B 满血版时,在 A800 集群的测试中,相比部分国外开源框架,实现了 GPU 使用量减少 50% ...
14 天on MSN
清华大学高性能计算研究所传来重要消息,翟季冬教授团队携手清华系科创先锋清程极智,共同宣布了一项重大开源成果——大模型推理引擎“赤兔 Chitu”。
今天为大家分享华中科大&地平线机器人最新的工作!AlphaDrive:首创VLM强化学习框架,破解自动驾驶长尾难题! 写在前面 & 笔者的个人理解 OpenAI o1 和 DeepSeek R1 在数学和科学等复杂领域达到了或甚至超越了人类专家的水平,强化学习(RL)和推理在其中发挥了 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果