首页>>互联网 >>内容

使用阿里巴巴新的EMO AI工具将图像转换为视频

发布时间:2024-03-04 08:58:29编辑:可爱的眼神来源:

在过去的两年里,我们见证了人工智能在互联网上日益增长的主导地位,这通过各种工具和应用程序得以体现。

使用阿里巴巴新的EMO AI工具将图像转换为视频

让图像栩栩如生

除了已经熟悉的聊天机器人之外,今天我们还有令人惊讶的现实工具来生成图像、音频和视频,甚至将音频转换为视频。

在最后一个方面,阿里巴巴推出了一种创新工具,让您可以通过歌曲或仅用您的声音将任何图像变为现实。

这家中国科技巨头 推出了一款应用程序,可以将图像和音轨作为参考,然后将它们组合起来生成照片中的人唱歌或说话的视频。

阿里巴巴计算智能研究院的研究团队将他们的新人工智能命名为“EMO”,这个名字来源于“Emote Portrait Alive”。这种创新工具能够将摄影肖像制作成动画,并生成所代表人物说话或唱歌时的视频。

该项目的官方网站展示了该技术的各种运行示例。此外,阿里巴巴还展示了一个受 OpenAI 的 Sora video 启发的示例,它的 AI 可以生成逼真的视频。

根据该研究论文,人工智能可以产生流畅、富有表现力的面部动作以及与歌曲或背景音频几乎完美同步的头部姿势。

音频转视频?是的,也是可以的

其广播方法能够高效地将音频转换为视频。研究人员使用广泛的数据集来训练该模型 ,其中包括超过 250 小时的演讲、电影、电视节目和音乐表演视频。

EMO 没有使用 3D 为照片赋予生命的幻觉,而是直接将音频波转换为视频帧。该技术使您能够捕捉与自然语音相关的微妙动作和特定身份特征。

根据该研究中详细的实验,EMO在视频质量、肖像身份保存和表达方面显着优于最先进的方法。