中国科技巨头在视频生成方面加大了投入力度:从腾讯的DynamiCrafter来看

腾讯将于周一发布最新版本的开源视频,展示其在中国互联网中的主导地位,拥有游戏帝国和微信聊天应用

中国科技巨头在视频生成领域加大力度,ENBLE的努力值得关注。

中国互联网巨头腾讯在周一发布了其开源视频生成模型DynamiCrafter的最新版本,并将其放在了GitHub上,这次发布让人们想起了中国一些最大的科技公司正在悄悄地在文本和图像转视频领域取得进展。但DynamiCrafter究竟是什么,有何与众不同之处呢?

扩散的力量:将字幕和图像转化为生动的视频

与市场上其他生成视频工具类似,DynamiCrafter利用扩散方法将字幕和静态图像转化为引人入胜的视频。受物理学中扩散现象的启发,机器学习中的扩散技术允许将简单的数据转化为更复杂、更真实的数据。它类似于粒子从高浓度区域移动到低浓度区域的方式。

DynamiCrafter的第二代能够以像素分辨率640×1024生成视频,相较于其去年十月发布的只支持320×512视频的初始版本,这是一个重大升级。DynamiCrafter团队在一篇学术论文中解释说,他们的技术之所以与竞争对手不同,是因为它将图像动画技术的适用范围扩展到了“更一般的视觉内容”。传统技术主要关注动画化自然场景或领域特定动作,而DynamiCrafter在生成过程中将图像纳入其中,利用了文本转视频扩散模型的动作先验知识。

DynamiCrafter的实际应用:瞥见动画世界

为了对比DynamiCrafter与其它视频扩散模型的效果,进行了一个演示,将DynamiCrafter与去年推出的Stable Video Diffusion以及最近备受关注的Pika Labs进行了对比。需要注意的是,演示中选择的样本可能会对DynamiCrafter产生偏向,但Tencent的模型似乎比其竞争对手产生了稍微更多的动画效果。然而,即使经过多次尝试,这些模型都不能给人以人工智能很快能够制作成完整电影的印象。

生成视频在人工智能竞赛中的崛起

生成视频在人工智能领域引起了很大的关注,继生成文本和图像取得成功之后成为下一个前沿。初创企业和科技巨头都在这个领域投入了大量资源,中国也不例外。除了腾讯,字节跳动(TikTok母公司)、百度和阿里巴巴等主要参与者都发布了自己的视频扩散模型。

字节跳动的MagicVideo和百度的UniVG都在GitHub上发布了演示,虽然尚未对公众开放。与腾讯一样,阿里巴巴通过向全球开发者社区开放其视频生成模型VGen来推广开源。显然,这些努力反映出了生成视频领域日益增长的兴趣和潜力。

问答:回答更多问题和关注点

问:DynamiCrafter是否可用于专业视频制作?

答:虽然DynamiCrafter在从文本和图像生成动画视频方面表现出了潜力,但目前还无法生产适用于专业视频制作的内容。然而,随着人工智能技术的不断发展,我们可以预见在这个领域会取得重大进展。

问:生成视频技术是否存在道德问题?

答:生成视频技术引发了关于人工智能生成内容的潜在滥用的道德问题。随着这些工具的不断提升,必须采取预防措施以确保内容的真实性,并防止误导性或虚假信息的传播。

问:生成视频将如何影响娱乐产业?

答:虽然生成视频有可能提升创造力并简化视频制作流程,但它们不太可能取代娱乐产业中对人类创造力和专业知识的需求。相反,这些工具可以作为内容创作者的强大辅助工具,使他们能够更高效地将想法变为现实。

视频生成与人工智能的未来

通过中国的主要科技公司发布DynamiCrafter和其他视频扩散模型,突显了生成视频在人工智能领域的日益重要性。随着这个领域的研究和开发不断进行,我们可以期待技术的进一步发展,推动人工智能在创造性内容生成方面的界限。

要了解视频生成和人工智能的最新发展,请参阅以下相关链接:

我们很想听听您对生成视频的未来及其潜在影响的想法。在社交媒体上分享您的意见并参与对话吧!