华为Pocket 2可折叠手机进入首销
2024-03-04
在过去的两年里,我们见证了人工智能在互联网上日益增长的主导地位,这通过各种工具和应用程序得以体现。
让图像栩栩如生
除了已经熟悉的聊天机器人之外,今天我们还有令人惊讶的现实工具来生成图像、音频和视频,甚至将音频转换为视频。
在最后一个方面,阿里巴巴推出了一种创新工具,让您可以通过歌曲或仅用您的声音将任何图像变为现实。
这家中国科技巨头 推出了一款应用程序,可以将图像和音轨作为参考,然后将它们组合起来生成照片中的人唱歌或说话的视频。
阿里巴巴计算智能研究院的研究团队将他们的新人工智能命名为“EMO”,这个名字来源于“Emote Portrait Alive”。这种创新工具能够将摄影肖像制作成动画,并生成所代表人物说话或唱歌时的视频。
该项目的官方网站展示了该技术的各种运行示例。此外,阿里巴巴还展示了一个受 OpenAI 的 Sora video 启发的示例,它的 AI 可以生成逼真的视频。
根据该研究论文,人工智能可以产生流畅、富有表现力的面部动作以及与歌曲或背景音频几乎完美同步的头部姿势。
音频转视频?是的,也是可以的
其广播方法能够高效地将音频转换为视频。研究人员使用广泛的数据集来训练该模型 ,其中包括超过 250 小时的演讲、电影、电视节目和音乐表演视频。
EMO 没有使用 3D 为照片赋予生命的幻觉,而是直接将音频波转换为视频帧。该技术使您能够捕捉与自然语音相关的微妙动作和特定身份特征。
根据该研究中详细的实验,EMO在视频质量、肖像身份保存和表达方面显着优于最先进的方法。
版权声明:本站所有作品图文均由用户自行上传分享,仅供网友学习交流。若您的权利被侵害,请联系我们
推荐阅读
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
2024-03-04
栏目热点
华为Pocket 2可折叠手机进入首销
iOS16.0.2软件更新中的新增功能
KhadasVIM1SAmlogicS905Y4单板电脑65美元
罗技与腾讯游戏合作开发了GCLOUD
MOREFINES600Apex功能强大的迷你电脑
MiraiSpeaker帮助有听力障碍的人再次享受音频
用AeroGuitar学习弹吉他
苹果发布iOS16.1公测版2
macOS13Ventura公测版6发布
Apple发布iOS16.0.2并修复了主要错误