AI视频又炸了!照片+声音变视频,阿里让Sora女主唱歌小李子说rap
2月28日,阿里巴巴智能计算研究所发布了一款全新的生成式AI模型EMO(Emote Portrait Alive)。EMO仅需一张人物肖像照片和音频,就可以让照片中的人物按照音频内容“张嘴”唱歌、说话,且口型基本一致,面部表情和头部姿态非常自然。EMO不仅能够生成唱歌和说话的视频,还能在保持角色身份稳定性的同时,根据输入音频的长度生成不同时长的视频。 EMO的工作过程分为两个主要阶段:首先,利用参
2024-02-29 09:43:19