字节跳动OmniHuman数字人模型即将上线:图音频结合,轻松生成视频!

发布时间:2025-03-23 13:21:33 来源:互联网

近期,抖音集团旗下备受瞩目的图片视频工具即梦AI在官方社交媒体上重磅发布了一条新功能上线预告片,预示着即梦AI又将带来全新的精彩体验!

字节跳动OmniHuman数字人模型即将上线:图音频结合,轻松生成视频!

视频显示,新功能采用了全新的多模态视频生成模型OmniHuman,让用户仅需输入一张图片和一段音频,就可以生成一条生动的AI视频,有望大幅提升AI短片的制作效率和质量。

OmniHuman技术主页信息显示,该模型为字节跳动自研的闭源模型,可支持肖像、半身以及全身等不同尺寸的图片输入,并根据输入的音频,在视频中让人物生成与之匹配的动作,包括演讲、唱歌、乐器演奏以及移动。

对于人物视频生成中常见的手势崩坏,也相比现有方法取得了显著的改善。

此外,对动漫、3D卡通等非真人图片输入的支持效果也较为出色,生成的视频能保持特定风格和原有的运动模式。

根据技术主页展示的演示效果来看,OmniHuman的生成效果已经具有较高的自然度。为防止该项技术被不当利用,字节跳动技术团队在主页中特别标注称,OmniHuman将不会对外提供下载。

即梦AI相关负责人透露,该模型目前已具备较好的表现,但在生成影视真实级别的视频上仍存在一定的提升空间。

由其支持的多模态视频生成功能会在即梦上以小范围内测的形式进行调优调整,并逐步开放。

该负责人同时表示,即梦还会对这一功能设置严格的安全审核机制,并且对输出的视频标注水印以作提醒,从而确保AI发挥正面、积极的作用,助力视频创作者更好地实现想象力的表达。

本周热门教程

1
“熟老太”背后的文化与技术:如何理解这一现象及其对社会的影响?

“熟老太”背后的文化与技术:如何理解这一现象及其对社会的影响?

2025/03/17

2
18_XXXXXL56HGlD到底代表什么?它在数字安全中的作用和潜力解析

18_XXXXXL56HGlD到底代表什么?它在数字安全中的作用和潜力解析

2025/03/17

3
美国为何“又粗又大”?探索美国在全球影响力背后的深层原因:经济、军事、科技与文化的全面分析

美国为何“又粗又大”?探索美国在全球影响力背后的深层原因:经济、军事、科技与文化的全面分析

2025/03/23

4
天堂JMComicron.MIC1.7.1版本更新有哪些亮点?性能优化和新功能值得期待

天堂JMComicron.MIC1.7.1版本更新有哪些亮点?性能优化和新功能值得期待

2025/03/17

5
如何在“麦子3HD”中有效偿还债务?提升收入与策略规划的关键要点

如何在“麦子3HD”中有效偿还债务?提升收入与策略规划的关键要点

2025/03/25

6
肉蔻之香2意大利版:为何它成为玩家最喜爱的冒险解谜游戏?

肉蔻之香2意大利版:为何它成为玩家最喜爱的冒险解谜游戏?

2025/03/25

7
国产❌❌❌❌69熟:为何越来越多消费者选择国产品牌而不是国际大牌?

国产❌❌❌❌69熟:为何越来越多消费者选择国产品牌而不是国际大牌?

2025/03/22

8
九阴争茎黑天使最后是否存活?揭秘黑天使结局背后的真相与未来发展

九阴争茎黑天使最后是否存活?揭秘黑天使结局背后的真相与未来发展

2025/03/24

9
如何免费观看《大地二》并享受最佳观影体验?探索最佳观看途径与观影小贴士

如何免费观看《大地二》并享受最佳观影体验?探索最佳观看途径与观影小贴士

2025/03/16

10
国产品牌崛起:“又粗又大”产品为何在市场中占据优势?

国产品牌崛起:“又粗又大”产品为何在市场中占据优势?

2025/03/24