谷歌最强视频生成AI模型Veo3亮相:背景音,人物对话都不在话下。

05-23 06:37

IT 世家 5 月 21 今年的日消息 I/O 谷歌在开发者大会上发布了新一代视频生成模型 Veo3,这也是第一个可以生成的视频背景音效模型。它不但可以生成图像,搭配相应的音效,如鸟鸣或街头交通等场景。,人物对话甚至可以产生。


谷歌称,Veo 3 同时在物理模拟和嘴型同步方面也表现出色。现在,这个模型只面向美国区域的 Gemini Ultra 客户,以及 Vertex AI 的企业客户开放,也已经集成到谷歌。 AI 电影制作工具 Flow 中。


客户仍可为 Veo 2 通过图像参考,提供人物、风格、场景或物体, Flow 利用镜头控制功能进行旋转、缩放,甚至将画面从坚屏调整到横屏,或者在视频中添加、删除元素。


目前,用户越来越难以辨别 AI 于是谷歌推出了产生内容 SynthID Detector。使用者可以上传媒体文件,以检测其是否包含 SynthID 谷歌用来识别水印。 AI 作品的标记工具。然而,并非所有图像生成模型都支持这个水印。


谷歌 I/O 开发者大会仍在进行中,IT 家庭将保持关注。


本文仅代表作者观点,版权归原创者所有,如需转载请在文中注明来源及作者名字。

免责声明:本文系转载编辑文章,仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布,请及时与我们联系进行审核处理或删除,您可以发送材料至邮箱:service@tojoy.com