该模型可以生成长达数小时的4K 分辨率人物动画,并且可以通过语音和文字提示进行精准控制。 Hallo2模型建立在 latent diffusion models 的基础上 ...