谷歌最强视频生成AI模型Veo3亮相：背景音，人物对话都不在话下。

2025-05-23

IT 世家 5 月 21 今年的日消息 I/O 谷歌在开发者大会上发布了新一代视频生成模型 Veo3，这也是第一个可以生成的视频背景音效模型。它不但可以生成图像，搭配相应的音效，如鸟鸣或街头交通等场景。，人物对话甚至可以产生。

谷歌称，Veo 3 同时在物理模拟和嘴型同步方面也表现出色。现在，这个模型只面向美国区域的 Gemini Ultra 客户，以及 Vertex AI 的企业客户开放，也已经集成到谷歌。 AI 电影制作工具 Flow 中。

客户仍可为 Veo 2 通过图像参考，提供人物、风格、场景或物体， Flow 利用镜头控制功能进行旋转、缩放，甚至将画面从坚屏调整到横屏，或者在视频中添加、删除元素。

目前，用户越来越难以辨别 AI 于是谷歌推出了产生内容 SynthID Detector。使用者可以上传媒体文件，以检测其是否包含 SynthID 谷歌用来识别水印。 AI 作品的标记工具。然而，并非所有图像生成模型都支持这个水印。

谷歌 I/O 开发者大会仍在进行中，IT 家庭将保持关注。

本文仅代表作者观点，版权归原创者所有，如需转载请在文中注明来源及作者名字。

免责声明：本文系转载编辑文章，仅作分享之用。如分享内容、图片侵犯到您的版权或非授权发布，请及时与我们联系进行审核处理或删除，您可以发送材料至邮箱：service@tojoy.com