Llama Project - 搜索 News

51CTO1 个月

Llama模仿Diffusion多模态涨分30%！不卷数据不烧卡，只需共享注意力分布

中国研究员联合DeepMind团队的最新研究《Lavender: Diffusion Instruction Tuning》，通过简单的“注意力对齐”，仅需1天训练、2.5%常规 ...

LLM-Dojo使用简洁且易阅读的代码构建LLM、VLM模型训练、RLHF框架等各种功能，使项目易于学习且方便魔改与实验，与大多开源框架相同均是基于huggingface。主要内容如下： SFT训练框架: 简洁清晰的开源大模型训练框架，支持Deepspeed多卡、Lora、QLora、全参等训练 ...

GitHub1 年

端侧可用的 GPT-4o 级视觉、语音、多模态实时流式大模型

欢迎试用！ [2025.01.19] 📢 注意! 我们正在努力将 MiniCPM-o 2.6 的支持合并到 llama.cpp、ollama、vLLM 的官方仓库，但还未完成。请大家暂时先使用我们提供的 fork 来进行部署：llama.cpp、ollama、vllm。合并完成前，使用官方仓库可能会导致不可预期的问题。 [2025.01.19] ⭐️ ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

今日热点