近年来,自动语音识别(ASR)技术已经进入了一个“百模大战”的时代,尤其是 Whisper 让许多人看到了高质量通用语音识别的可能性。 然而,Whisper 等主流模型在支持多语言的同时,也面临着一个痛点:它们的优化往往偏向英语或西方语言,对于东方语言,特别是复杂的汉语方言和少数民族语言,识别效果并不尽如人意。 最近,清华大学和海天瑞声联手开源的 Dolphin 语音识别模型,给语音识别领域带来了 ...
近日,谷歌与计算机历史博物馆(CHM)联合发布了 AlexNet 项目源代码。目前,项目的 Python 代码已作为开源软件在 CHM 的 GitHub 页面上对外开放,允许 AI 爱好者和研究人员一窥这项在计算发展史上开天辟地的关键成果。
整理 | 华卫、核子可乐近日,谷歌与计算机历史博物馆(CHM)联合发布了 AlexNet 项目源代码。目前,项目的 Python 代码已作为开源软件在 CHM 的 GitHub 页面上对外开放,允许 AI ...
新模型版本为DeepSeek-V3-0324,参数量为6850亿,相较上个版本参数增幅不大(6710亿)。 从发布时间和技术特点来看,DeepSeek-V3-0324,很可能是DeepSeek-R2的基础架构。 所以按照DeepSeek一贯的产品发布节奏(先推出基础模型,几周后再发布专门的推理增强版)来看,DeepSeek-R2很可能在几周后就将上线!
根据网友Xeophon的自测,DeepSeek-V3-0324所有指标性能暴涨,击败了Claude 3.5 Sonnet,成为目前最强的非推理模型。
当毫米波雷达遇见边缘AI,IWRL6432的进化路径已清晰可见。下一代产品或将集成NPU单元,实现端侧的人员身份识别和行为预测。在频谱利用方面,动态频率调整技术有望进一步提升多设备协同能力。随着全球60GHz频段监管的逐步开放,这颗微型芯片或将成为构建智能城市感知网络的原子节点。
人人都是产品经理 on MSN15 天
最新开源!真的可以用AI 在blender里建模!
一个开源的AI项目在GitHub上引起了广泛关注,它能够让设计师通过简单的对话在Blender中实现自动建模。本文将详细介绍这个项目的使用方法,包括安装步骤、配置过程以及实际操作中的体验。 最近,我在github上发现一个非常火的AI项目,这几天才刚刚开源,转眼就已经5.4K的星标了。它能通过咱们常用的AI对话,帮我们在Blender中建模。 当我跟AI对话,然后blender中全自动脱手建模的那 ...
AMD在官网开源了最新小参数模型Instella-3B。比较特别的是,这是一个基AMD Instinct™ MI300X GPU从头训练的模型。 根据测试数据显示,Instella-3B的性能超过了Llama-3.2-3B、Gemma-2-2B,可以媲美阿里开源的Qwen-2.5-3B,这也证明了AMD的GPU也能训练出高性能的大模型。 开源地址:https://huggingface.co/am ...
同时,基于英特尔酷睿Ultra系列处理器打造的AI PC,可以说是性能体验最好、稳定性最好、兼容性最好的本地化AI部署平台。Ollama、Flowy、LM Studio、Miniforge等常用软件全部支持,并且支持Intel OpenVINO加速,再加上酷睿Ultra 200系列平台本身在CPU、GPU、NPU ...
开源的泛中日韩像素字体,黑体无衬线风格,支持 8、10 和 12 像素。 该项目为 「方舟像素字体」的临时性过渡方案。使用多个像素字体合并而成,因此以「缝合」命名。 Logo 捏他自 《游戏王》中的 「融合」魔法卡卡图。 这个项目提供了从提取字模,合并字形 ...