Type something to search...

Trepa

ByteDance 发布开源唇语同步人工智能模型

ByteDance 发布开源唇语同步人工智能模型

字节跳动最近推出了 LatentSync,这是一个新的最先进的开源视频唇动同步模型。它是一个基于音频条件的潜在扩散模型的端到端唇动同步框架。 这听起来有点复杂,但它的意思是你可以上传一个人说话的视频和一个你想用来替代原始音频的音频文件。然后,AI 会覆盖新的音频,并调整说话者的唇部动作,以完美匹配上传的音频。 最

阅读更多