Transformers 7 - 搜索 News

资讯

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

Llama-3.1-Nemotron-Ultra-253B-v1 是一个拥有 2530 亿参数的密集模型，旨在支持高级推理、指令遵循和 AI 助手工作流程。该模型最早在今年 3 月 Nvidia 年度 GPU 技术大会 (GTC) 上被提及。

1 天

AI科学家首度通过ICLR审稿，零人工生成论文恐将重塑科研界！

在一个令人震惊的时刻，首位AI科学家AIScientist以其全新版本2.0成功在国际顶级会议ICLR上发布了一篇完全由人工智能生成的研究论文。整个研究过程从选题到实验均由AI独立完成，甚至GitHub上的代码库也是AI编撰的。这一令人振奋的进展，使得AI在科学研究中展现出前所未有的潜力。

1 天

AI封神了！无剪辑一次直出60秒《猫和老鼠》片段，全网百万人围观

研究者策划了一个文本到视频的数据集，该数据集基于大约 7 ...

腾讯网2 天

万字熟悉：面向技术管理者的大模型术语集

欢迎关注下方公众号阿宝1990，本公众号专注于自动驾驶和智能座舱，每天给你一篇汽车干货，我们始于车，但不止于车。技术管理者作为系统组合者，追求整体系统的最优化，并对整体最终结果负责。技术管理者对组成系统的砖块，可以仅限于了解输入输出和基本原理，而对砖 ...

知乎 on MSN3 天

如何评价Meta刚刚发布的LLama 4系列大模型？

Meta颓势尽显，从llama3.1起，技术上insight就慢慢落后了。回首往昔，llama2还真是最巅峰。眼看他起高楼，眼看他宴宾客，新Llama4系列叫做Scout，Maverick，Behemoth。这三个名字真是拗口，看来是我孤陋寡闻了。那不妨依次称之为中杯，大杯，超大杯吧。乍一看，三个杯都是MoE，为了性能舍弃陈腐Dense，是好事一桩; ...

腾讯网6 天

多榜单登顶！华为 & 哈工深团队提出 AdaReTaKe，突破长视频理解极限

第一作者为哈尔滨工业大学（深圳）博士生王霄和华为大模型研究员佀庆一，该工作完成于王霄在华为实习期间。王霄的研究方向为多模态视频理解和生成，佀庆一的研究方向为多模态理解、LLM post-training和高效推理。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果