Hugging Face Transformer

23 小时

Transformer模型的跨界奇迹 ...

23 小时

因此，对于正在考虑出国留学的同学而言，深入了解诸如Transformer这样前沿的AI技术，不啻于为自己的未来铺路。在这个过程中，托福、雅思等英语水平考试的准备也显得尤为重要，不仅是为了满足学术课程的要求，更是为自己在国际舞台上赢得一席之地。

51CTO15 天

在 Hugging Face 上部署语音转语音模型

S2S (语音到语音) 是 Hugging Face 社区内存在的一个令人兴奋的新项目，它结合了多种先进的模型，创造出几乎天衣无缝的体验: 你输入语音，系统会用合成的声音进行回复。该项目利用 Hugging Face 社区中的 Transformers 库提供的模型实现了流水话处理。该流程处理由 ...

29 天

历时6个月，Hugging Face开源LLM「超大规模实战手册」！200页3万字4000次 ...

【新智元导读】 Hugging Face发布了「超大规模实战手册」，在512个GPU上进行超过4000个scaling实验。联创兼CEO Clement对此感到十分自豪。 HuggingFace联创兼CEO ...

腾讯网6 天

无需Attention的未来，RWKV-7能成为替代Transformer的那只黑天鹅吗？

作者｜周一笑邮箱｜[email protected]在当今大模型领域，Transformer架构占据着主导地位。然而，尽管Transformer非常强大，但它的计算需求随着文本长度呈平方级增长，这导致运行成本高昂，同时限制了其扩展能力。与 ...

51CTO28 天

历时6个月，Hugging Face开源LLM「超大规模实战手册」！200页3万字4000次 ...

Hugging Face发布了「超大规模实战手册」，在512个GPU上进行超过4000个scaling实验。联创兼CEO Clement对此感到十分自豪。最近，Hugging Face发布了一个「超大规模训练手册」，教我们如何在GPU集群上训练LLM。这项震撼的研究，在512个GPU上做了超过4000个Scaling实验，并 ...

腾讯网3 天

3D领域DeepSeek「源神」启动！国产明星创业公司，一口气开源八大项目

毫无疑问，开源正成为国内外大模型厂商的「战略共识」。从文本到视觉，从对话到推理，开源生态的繁荣正推动大模型技术快速迭代。在这一波生成式 AI ...

澎湃新闻27 天

历时6个月，Hugging Face开源LLM“超大规模实战手册”

【新智元导读】Hugging Face发布了「超大规模实战手册」，在512个GPU上进行超过4000个scaling实验。联创兼CEO Clement对此感到十分自豪。最近，Hugging Face发布了一个「超大规模训练手册」，教我们如何在GPU集群上训练LLM。这项震撼的研究，在512个GPU上做了超过4000个 ...

鞭牛士5 天

通义千问发布新一代端到端多模态旗舰模型 Qwen2.5-Omni

3月27日，通义千问宣布发布新一代端到端多模态旗舰模型 Qwen2.5-Omni。该模型现已在 Hugging Face、ModelScope、DashScope 和 GitHub上开源开放。据介绍，该模型专为全方位多模态感知设计，能够无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时 ...

9 天

北京：以开源之势加速打造人工智能创新高地

今年，北京将从加速国产大模型多维度创新、推动技术路线多元化布局、持续推进芯片“根技术”创新等方面助推人工智能技术发展，包括聚焦更高泛化性能、更低训练成本、更强推理效率的下一代大模型研发，分层布局强化学习、统一原生多模态等关键技术研究；聚焦非Transformer架构模型算法，建立非共识创新机制，分阶段布局多元化技术路线，解决大模型计算复杂度高、模型能耗大等问题。

5 天

阿里云通义千问发布新一代端到端多模态旗舰模型 Qwen2.5-Omni 并开源 ...

IT之家 3 月 27 日消息，今日凌晨，阿里云发布通义千问 Qwen 模型家族中新一代端到端多模态旗舰模型 ——Qwen2.5-Omni，并在 Hugging Face、ModelScope、DashScope 和 GitHub 上开源。

十轮网科技资讯 on MSN17 天

加拿大AI创业公司Cohere发布只需要两个A100即可部署的AI模型

加拿大AI创业公司Cohere周四（3/13）发布了新一代AI模型Command A，只需要两个A100或H100的Nvidia GPU就可部署，宣称该模型在代理企业任务上的表现与GPT-4o及DeepSeek-V3相当，能够以最少的硬件提供最大的性能。 Cohere是在2019年由Aidan Gomez、Ivan Zhang及Nick ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果